买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深度(山东)数字科技集团有限公司
摘要:本发明涉及信息管理技术领域,尤其涉及一种用于企业融资额度估算的商业汇票大数据分析方法。本发明方法,根据企业历史汇票交易数据,通过离群值逐步收敛法寻找模型效果最优点,使模型效果影响比较大的离群值逐步收敛,降低离群值对模型训练的噪声干扰,使模型更加稳定;本发明方法,基于解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,使之与响应变量之间的相关关系的方差扰动降低,应用方差膨胀因子减少多重共线性影响,使模型泛化能力更加稳健;本发明方法,应用企业实际授信额度与预测额度之间的差值评估算法结果授信额度的可信性,能够精准预测企业贷款授信额度。
主权项:1.一种用于企业融资额度估算的商业汇票大数据分析方法,将企业授信金额定义为响应变量,将企业特征指标定义为模型解释变量,方法模型主要采用解释变量对响应变量进行学习,得到能够针对样本外的企业解释变量去预测响应变量值,包括:S1解释变量离群值处理,应用离群值优化算法,通过离群值逐步收敛法寻找模型效果最优点从而达到降低离群值对模型训练的噪声干扰,所述为解释变量与响应变量之间的训练模型计算值;模型效果决定系数是对线性模型评估的一种评价指标,其值最大为1,最小为0;当值越接近于1,则说明模型越好,此时参数为最优值;值越接近于0,则模型越差;公式: ;其中,表示模型估计值,表示样本原始值,表示样本原始值的均值;S2解释变量离散化处理,利用最小二乘离散化方法对解释变量进行预处理,使之与响应变量之间的相关关系的方差扰动降低,从而使模型泛化能力更加稳健;最小二乘离散化方法公式: ; ; ;上述公式表达为选取待切分离散化的第j个X变量,遍历其切分点s,使得数据集D划分为和,和分别为数据集和中Y对应的均值,寻找使得上述表达式值最小的切分点s;S3算法训练构建模型,基于上述两类分析方法处理的解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,并用方差膨胀因子VIF进行多重共线性检验;S3.1采用多元线性回归算法,公式: ;S3.2参数估计方法损失函数: ;其中,i表示第i个样本,n为样本总数,表示因变量模型估计值,表示因变量样本原始值,由链式法则对中的求偏导数,得到: ;上述公式k表示第k个解释变量或参数,两边同时乘以,令d=,经过矩阵式转换,得到: ; ;由于参数最优化求解的需要,且L为非凸函数,当时损失函数L值可达到最小,该方法称为最小二乘参数求解法,在等式两边从左侧同时乘以,得到: ;S3.3应用方差膨胀因子VIF对回归变量间共线性检验,公式: ;其原理是把第i个解释变量作为响应变量,将其余N-1个变量作为解释变量,作线性回归计算模型得出判决统计量方差膨胀因子VIF,所述为第i个解释变量与其他解释变量之间的;方差膨胀因子越大,说明越接近1,则第i个解释变量与其他解释变量之间共线程度越强;如果方差膨胀因子VIF大于,则认为该变量与剩余N-1个变量之间具备多重共线性,因而剔除该变量;所述的取值范围3~10;S4对模型算法进行效果统计与评估,评分模型效果误差统计与分布: ; 为企业实际授信额度与预测额度之间的差值,当误差表现出为均值为0的渐近正态分布时,模型效果最佳。
全文数据:
权利要求:
百度查询: 深度(山东)数字科技集团有限公司 一种用于企业融资额度估算的商业汇票大数据分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。