山东省征信有限公司徐伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东省征信有限公司申请的专利基于无噪损失分布迁移的信贷数据合成过采样方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121167241B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511685843.4,技术领域涉及:G06F18/21;该发明授权基于无噪损失分布迁移的信贷数据合成过采样方法及系统是由徐伟;王继瑞;盛兴亚;阎锦韬设计研发完成,并于2025-11-18向国家知识产权局提交的专利申请。
本基于无噪损失分布迁移的信贷数据合成过采样方法及系统在说明书摘要公布了:本发明公开了一种基于无噪损失分布迁移的信贷数据合成过采样方法及系统,涉及人工智能和数据挖掘中的不平衡分类技术领域,包括:获取原始信贷非平衡数据集;对该数据集进行噪声标签样本过滤,通过模型预测出数据集中每个样本的预测概率并计算其无噪损失值;根据无噪损失值的取值范围划分多个损失区间,将每个样本分配至对应损失区间,确定多数类和少数类样本的无噪损失分布;基于无噪损失分布进行迁移,确定合成样本分布,以此筛选出根样本和辅助样本,再经线性插值合成少数类伪样本;将少数类伪样本添加到原始信贷非平衡数据集中,得到类别平衡的信贷数据集。本发明优化后的平衡数据集可实现多数类样本和少数类样本识别精度的有效提高。
本发明授权基于无噪损失分布迁移的信贷数据合成过采样方法及系统在权利要求书中公布了:1.一种基于无噪损失分布迁移的信贷数据合成过采样方法,其特征在于,包括: 获取原始信贷非平衡数据集;其中,该数据集包含标注为违约的少数类样本和标注为非违约的多数类样本; 对原始信贷非平衡数据集进行噪声标签样本过滤,再通过模型预测出数据集中每个样本的预测概率,并计算每个样本的无噪损失值,包括: 利用置信学习算法过滤原始信贷非平衡数据集中的噪声标签样本,得到无噪信贷数据集;基于无噪信贷数据集,对逻辑回归模型进行5折交叉验证,预测得到每个样本的预测概率;所述预测概率为预测样本为少数类样本的概率; 根据无噪损失值的取值范围划分多个损失区间,将每个样本分配至对应的不同损失区间,确定多数类和少数类样本的无噪损失分布; 基于无噪损失分布进行迁移,确定合成样本分布,即保持少数类样本和多数类样本在损失区间上的分布一致,将多数类样本的无噪损失分布迁移到至少数类样本中,包括: 遍历多数类样本的无噪损失分布向量和少数类样本的无噪损失分布向量,筛选出多数类样本数量大于少数类样本数量的损失区间作为目标损失区间,并计算每个目标损失区间内多数类样本与少数类样本的数量差,该数量差即为对应目标损失区间内需合成的少数类伪样本数量, 再根据合成样本分布筛选出根样本和辅助样本,经线性插值合成少数类伪样本,包括: 选择每个目标损失区间内的少数类样本作为根样本; 针对每个根样本,确定其k个损失近邻,并从k个损失近邻中随机选择一个样本作为辅助样本;所述损失近邻为与根样本无噪损失值差的绝对值最小的样本; 将少数类伪样本添加到原始信贷非平衡数据集中,得到类别平衡的信贷数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东省征信有限公司,其通讯地址为:250000 山东省济南市历下区奥体西路2788号A塔;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励