买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京冰鉴信息科技有限公司
摘要:本申请设计的一种基于企业财税数据的金融风控方法,通过协议接口接收来自企业与税务和财务相关的结构化数据,然后针对所述结构化数据进行数据解析。在模型构建方面,现有技术未针对不同行业特性进行分行业、分维度训练模型,本发明则将样本划分为10个不同各行业,从6个不同维度全面挖掘财税数据中的金融风险。在构建模型过程中,本发明结合IV图趋势和业务经验相结合的方法筛选出规则特征和入模特征,规则特征通过设置减分的方式,将具有严重风险的企业识别出来。最后将不同行业的评分卡模型的分数等级区间拉齐至同一水平,方便不同行业最终的评分比较,从而全面挖掘企业财税数据中存在的金融风险。
主权项:1.一种基于企业财税数据的金融风控方法,其特征在于,包括:步骤S1、通过协议接口接收来自企业的财税结构化数据;针对所述财税结构化数据进行数据解析;步骤S2、针对解析后的数据进行特征衍生,获取基础信息维度衍生特征数据、经营规模维度衍生特征数据、经营稳定性维度衍生特征数据、经营成长性维度衍生特征数据、履约历史维度衍生特征数据、财务信息维度衍生特征数据;步骤S3、按照国民经济行业分类将样本数据分成农、林、牧、渔业,制造业采矿业,电力、热力、燃气及水生产和供应业,交通运输、仓储和邮政业,住宿和餐饮业,批发和零售业,信息传输科学研究,建筑业,房地产业,其他,共10个行业,获取各个行业的财税结构化数据作为样本数据,并分行业进行特征解析,从基础信息维度、经营规模维度、经营稳定性维度、经营成长性维度、履约历史维度、财务信息维度这6个维度来衍生样本特征数据;并与其对应的标签y进行拼接,以构建行业特定的训练集;步骤S4、针对衍生样本特征数据,使用卡方分箱的方法进行分组,计算IV值、绘制IV图并计算各分箱对应的坏账率;筛选出分箱数较少、且各分箱对应的坏账率区别较大的衍生样本特征数据作为逻辑回归模型的前置规则,这些规则的阈值设置则分别根据各自行业分箱对应的阈值来决定;步骤S5、根据这10个行业的衍生样本特征数据,结合IV图和业务逻辑,从剩下的衍生样本特征数据中逐步筛选入模特征,构建逻辑回归模型,并转化成各行业的评分卡模型;步骤S6、用各行业的评分卡模型在各自行业样本中进行打分,并根据模型分数进行模型评估和调整,确保命中规则的样本平均分数低于未命中规则的样本平均分数,获取各行业最终模型;步骤S7、将各行业最终模型评估的分数按照相同的样本占比划分成A、B、C、D、E五个等级,并通过调整各行业评分卡模型将的五个等级对应的分数阈值进行拉齐,方便不同行业最终的评分比较。
全文数据:
权利要求:
百度查询: 南京冰鉴信息科技有限公司 一种基于企业财税数据的金融风控方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。