首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于表格型数据的用户还款行为预测方法、系统和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江孚临科技有限公司

摘要:本发明公开了基于表格型数据的用户还款行为预测方法、系统和存储介质,通过获取待评估用户的贷款评估数据,将所述贷款评估数据输入训练完成的还款预测模型中,得到所述待评估用户的还款概率,其中所述还款预测模型基于用户贷款信息统计表格训练得到,所述用户贷款信息统计表格包括按行记录的多个用户的贷款评估数据的样本,且至少包括一具有按时还款标签的用户样本数据、一具有不按时还款标签的用户样本数据、和一无标签的用户样本数据,最后根据所述待评估用户的还款概率来对用户进行层级划分,并按所划分层级来确定放款数量,以提高用户风险管理数据的利用率、增强对用户还款行为预测的准确性和可靠性。

主权项:1.基于表格型数据的还款预测模型训练方法,其特征在于,包括:使用用户贷款信息统计表格数据训练还款预测模型,所述用户贷款信息统计表格包括按行记录的多个用户的贷款评估数据的样本,其中至少包括一具有按时还款标签的用户样本数据、一具有不按时还款标签的用户样本数据、和一无标签的用户样本数据;所述还款预测模型被配置为包括嵌入层、编码器层和全连接网络层的三层架构模式,其中所述嵌入层被配置为将用户贷款信息统计表格中的每一列的同一类别的用户特征数据转换为对应的m个第一n维向量,其中m为所述用户贷款信息统计表格中的贷款评估数据的特征类别数量,n为大于1的整数;所述编码器层,被配置为将所述的m个第一n维向量作为输入量,输入到该编码器层进行特征相关性处理后输出与对应的m个第一n维向量具有相同维度的m个第二n维向量;所述全连接网络层,用于将所述的m个第二n维向量并排拼接成一个长度为m*n的一维向量来作为输出量;其用于预测特征的输出层包括a个归一化指数函数层用于预测贷款评估数据中的离散特征,各离散特征数据输出节点数为该离散特征数据包含的所有可能的数据取值数量;b个单节点层用于预测贷款评估数据中的连续特征;c个第一概率输出层用于预测标签的掩码向量;1个第二概率输出层用于预测伪标签;其中a为贷款评估数据中的离散特征数据的类别数,b为贷款评估数据中的连续特征数据的类别数,c为a与b相加的和;其中a个归一化指数函数层选择使用交叉熵损失来度量预测与真实标签之间的差异;b个单节点层选择使用平方损失来度量预测与真实标签之间的差异;c个第一概率输出层选择使用交叉熵损失来度量预测与真实标签之间的差异;1个第二概率输出层选择使用交叉熵损失来度量预测与真实标签之间的差异;在输入嵌入层前先对样本数据的离散特征和连续特征进行随机掩码替换,将每个位置掩码为1的特征值换为替换值,所述替换值为随机采样获取所述用户贷款信息统计表格中包含的各无标签的用户样本数据中的所对应同类别的离散特征和连续特征的值;将样本中进行掩码替换后的每个离散特征和连续特征都嵌入成同样长度的第一n维向量,若样本中的存在离散特征缺失值则将其单独转换为一个第一n维向量,若样本中的存在连续特征缺失值则将其替换成0后,映射成全0的第一n维向量;将替换后的m个第一n维向量作为编码器层的输出;通过获取最终的损失函数值来进行反向传播来训练还款预测模型,通过将利用具有标签的用户样本数据训练好的多个xgboost逻辑斯蒂回归模型来对输入数据进行处理产生对应的多个预测伪标签,基于这多个xgboost逻辑斯蒂回归模型输出的置信度,把所述的多个预测伪标签整合成一伪标签并输出,其中所述伪标签取值为0或1;在使用无标签数据的预训练完成后,通过有监督训练使用样本中的有标签数据对模型进行微调训练,获取训练完成的还款预测模型;获取待评估用户的贷款评估数据,将所述贷款评估数据输入训练完成的还款预测模型中,得到所述待评估用户的还款概率,根据所述待评估用户的还款概率来对用户进行层级划分,并按所划分层级来确定放款数量。

全文数据:

权利要求:

百度查询: 浙江孚临科技有限公司 基于表格型数据的用户还款行为预测方法、系统和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。