买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东精点数据科技股份有限公司
摘要:本申请提供一种面向金融大数据融合分析方法,包括:根据不同贷款中介群体的消费贷期限偏好占比、抵押商品类型差异化占比、还款方式偏好占比和风险水平,并通过正交表实验设计方法,生成与贷款中介群体相匹配的最优消费贷产品方案,包括消费贷金额、期限、利率和还款方式;根据最优消费贷产品方案,通过条件随机场算法,构建申请材料识别模型,对贷款中介提交的申请材料进行结构化提取,通过命名实体识别对关键要素信息进行识别,并与预设申请模板进行比对,采用编辑距离算法识别出填写缺失或不合规之处,生成申请审核报告。
主权项:1.一种面向金融大数据融合分析方法,其特征在于,所述方法包括:获取贷款中介的消费贷业务数据指标,包括消费贷申请数量分布信息、客户信用评分区间占比、消费贷金额区间分布、消费贷期限偏好占比、抵押商品类型差异化占比、还款方式偏好占比、逾期率水平分布和逾期时长分布特征,采用余弦相似度算法,计算贷款中介在消费贷业务数据指标的差异值,构建多维度差异矩阵;根据多维度差异矩阵,采用基于欧氏距离的K-means聚类算法,对所有贷款中介进行聚类划分,得到不同的贷款中介群体,分析贷款中介群体在消费贷申请数量分布、客户信用评分区间占比,确定贷款中介群体的风险水平,根据风险水平生成差异化营销方案和风控策略;根据不同贷款中介群体的消费贷期限偏好占比、抵押商品类型差异化占比、还款方式偏好占比和风险水平,并通过正交表实验设计方法,生成与贷款中介群体相匹配的最优消费贷产品方案,包括消费贷金额、期限、利率和还款方式;根据最优消费贷产品方案,通过条件随机场算法,构建申请材料识别模型,对贷款中介提交的申请材料进行结构化提取,通过命名实体识别对关键要素信息进行识别,并与预设申请模板进行比对,采用编辑距离算法识别出填写缺失或不合规之处,生成申请审核报告;根据申请审核报告,获取不同贷款中介的客户逾期率水平分布和逾期时长分布特征,建立风控审批规则差异化配置模型,根据客户信用评分区间占比、消费贷金额区间分布和抵押商品类型差异化占比,通过基尼指数进行特征选择,对不同贷款中介群体的审批规则阈值进行差异化设置,包括:根据申请审核报告,获取不同贷款中介的客户逾期率水平分布和逾期时长分布特征,对特征数据进行清洗、转换和标准化处理,得到数据集;通过特征工程方法,根据所述数据集提取出与贷款中介客户逾期风险相关的关键特征,包括逾期率均值、逾期率方差、逾期时长均值和逾期时长方差,构建风控审批规则差异化配置模型;采用基尼指数对客户信用评分区间占比、消费贷金额区间分布和抵押商品类型差异化占比进行特征选择,通过计算每个特征的基尼指数,判断其对逾期风险的贡献度,选出对逾期风险区分度最高的5个特征,作为所述风控审批规则差异化配置模型的输入;针对不同的贷款中介群体,根据特征选择结果,采用K-means聚类算法进行客户群体划分,将聚类结果与实际逾期标签进行映射,得到每个类别的风险等级,包括高风险群体、中风险群体和低风险群体;针对不同风险等级的群体,根据消费贷金额、客户信用评分、抵押率和还款能力维度,设置差异化的审批规则阈值,具体为:在风控审批规则差异化配置模型中,通过决策树或随机森林算法,根据不同贷款中介群体的客户逾期率水平分布和逾期时长分布特征,自动生成相应的审批规则阈值;采用LightGBM算法,融合各贷款中介的客户历史消费贷表现数据,通过特征工程从客户历史消费贷表现数据中提取风险特征集,通过最小-最大规范化对风险特征集进行处理后,使用网格搜索优化模型超参数,训练风险评估模型,对目标贷款中介的客户消费贷申请进行风险预测,将预测结果用于审批规则阈值的动态调整;根据各贷款中介的客户逾期率水平分布,对月度逾期率超过预设阈值且逾期金额超过预设金额的贷款中介执行重点监控,采用基于Apriori关联规则挖掘的逾期预警模型,从多维业务数据中挖掘逾期风险信号,若触发预警次数大于预设预警阈值,则通过消息中间件,向贷款中介发送预警通知,触发催收流程启动。
全文数据:
权利要求:
百度查询: 广东精点数据科技股份有限公司 一种面向金融大数据融合分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。