恭喜浙江惠瀜网络科技有限公司周波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江惠瀜网络科技有限公司申请的专利基于五折交叉验证的评分卡建模方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115114851B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210713602.6,技术领域涉及:G06F30/27;该发明授权基于五折交叉验证的评分卡建模方法及装置是由周波;张建业;王振涛;陈蓓珍;林敏设计研发完成,并于2022-06-22向国家知识产权局提交的专利申请。
本基于五折交叉验证的评分卡建模方法及装置在说明书摘要公布了:本发明公开了一种基于五折交叉验证的评分卡建模方法及装置,通过定义目标变量;获取原始变量数据,形成样本数据集;对所述原始变量数据进行分箱处理,计算每箱变量的证据权重值、以及变量对应的信息值;采用皮尔逊相关系数计算变量之间的相关性,对共线性的变量进行筛选;基于原始变量数据和目标变量构建五折交叉验证标签;利用五折交叉验证标签将样本数据集随机划分成五份,将五折数据分别采用LightGBm算法进行训练,得到评分卡模型。本发明能够很好地适用于当前的信贷场景中,充分挖掘海量第三方数据中的深层特征,以提升评分卡对于不同用户的区分效果。
本发明授权基于五折交叉验证的评分卡建模方法及装置在权利要求书中公布了:1.一种基于五折交叉验证的评分卡建模方法,其特征在于,包括:定义目标变量,将逾期天数超过预设天数的用户定义为负样本,将逾期天数未超过预设天数的用户定义为正样本;获取原始变量数据,所述原始变量数据包括金融机构数据和第三方数据,形成样本数据集;对所述原始变量数据进行分箱处理,计算每箱变量的证据权重值、以及变量对应的信息值;采用皮尔逊相关系数计算变量之间的相关性,对共线性的变量进行筛选;基于所述原始变量数据和所述目标变量构建五折交叉验证标签;利用所述五折交叉验证标签将样本数据集随机划分成五份,将五折数据分别采用LightGBm算法进行训练,得到评分卡模型;其中,对所述原始变量数据进行分箱处理,计算每箱变量的证据权重值、以及变量对应的信息值;采用皮尔逊相关系数计算变量之间的相关性,对共线性的变量进行筛选,包括:所述计算每箱变量的证据权重值,证据权重值的计算式如下: 其中,WOEi表示第i个分箱的证据权重值,pi,good、pi,bad分别表示第i个分箱中正、负样本数与样本总数的比例;所述计算变量对应的信息值,信息值的计算式如下: 其中,N表示变量分箱的数量,WOEi表示第i个分箱的证据权重值,pi,good、pi,bad分别表示第i个分箱中正、负样本数与样本总数的比例;所述皮尔逊相关系数计算变量之间的相关性,计算式如下: 其中,r表示变量X、Y的皮尔逊相关系数,Xk,k=1,2,…N表示第k个样本中变量X的取值,表示变量X的均值,Yk,k=1,2,…N表示第k个样本中变量Y的取值,表示变量Y的均值,N为样本总数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江惠瀜网络科技有限公司,其通讯地址为:311200 浙江省杭州市萧山区萧山经济技术开发区明星路371号1801-1室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。