首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于大数据的应收账款资料真实性智能识别审核系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖北盈嘉集团有限公司

摘要:本申请提供一种基于大数据的应收账款资料真实性智能识别审核系统,包括:数据获取单元,用于获取待审核企业的目标财务数据,其中,目标财务数据包括企业年报、销售订单信息、采购订单信息、回款信息、付款信息和待审核企业所在行业的行业数据;数据处理单元,用于对目标财务数据进行预处理;样本化单元,用于对预处理后的目标财务数据进行样本化处理,确定出待审核企业对应的目标样本;智能审核单元,用于将目标样本输入至预设的资料审核模型中,确定出资料真实性审核结果并输出。本方案能够充分利用大数据的优势,考虑应收账款资料中的数据特点,准确而高效地实现对应收账款资料的真实性审核。

主权项:1.一种基于大数据的应收账款资料真实性智能识别审核系统,其特征在于,包括:数据获取单元,用于获取待审核企业的目标财务数据,其中,目标财务数据包括企业年报、销售订单信息、采购订单信息、回款信息、付款信息和待审核企业所在行业的行业数据;数据处理单元,用于对目标财务数据进行预处理;样本化单元,用于对预处理后的目标财务数据进行样本化处理,确定出待审核企业对应的目标样本;智能审核单元,用于将目标样本输入至预设的资料审核模型中,确定出资料真实性审核结果并输出;资料审核模型的构建过程为:S1:获取企业数据集,其中,企业数据集包括N个企业的财务数据,其中,每个财务数据包括企业年报、销售订单信息、采购订单信息、回款信息、付款信息和该企业所在行业的行业数据,以及标注的样本标签,其中,样本标签为真实样本或虚假样本;S2:对企业数据集中每个企业的财务数据进行预处理;S3:对每个预处理后的财务数据进行样本化处理,确定出每个企业对应的样本,共确定出N个样本;S4:对N个样本进行聚类,确定出k个聚类,并生成包含N个k维列向量的k×N的特征矩阵,其中,每个列向量对应一个企业,每行对应一个聚类后的新特征;S5:将特征矩阵划分训练集和测试集,利用训练集对初始模型进行训练,利用测试集对训练后的模型进行测试,得到训练好的识别模型,其中,进行特征转换的聚类模型和进行真实性识别的识别模型作为资料审核模型;其中,S4:对N个样本进行聚类,确定出k个聚类,并生成包含N个k维列向量的k×N的特征矩阵,包括:S41:对N个样本形成样本集X,利用肘部法或轮廓系数法确定聚类中心的个数k,并随机选取k个样本作为初始的聚类中心;S42:计算样本集X中每个样本xi与每个聚类中心的相似度,并分配到相似度最高的聚类中;S43:针对每个聚类,计算当前聚类中的所有样本的平均值,更新当前聚类中心,之后执行S44;S44:判断是否达到终止条件:若未达到终止条件,重复S42和S43;若达到终止条件,执行S45,其中,终止条件为第I+1次聚类的代价函数与第I次聚类的代价函数之差小于收敛极限;S45:基于k个聚类中心对每个样本进行特征转换,得到包含N个k维列向量的k×N的特征矩阵F;S42中,样本xi=[xi1,xi2,…,xiZ],采用以下公式计算样本集X中每个样本xi与每个聚类中心的相似度: 其中,表示样本xi与第I次迭代中第j个聚类中心的相似度,σ为常数,用于调节样本与聚类中心的距离变化时的密度,Z为样本xi的属性总数,xim表示样本xi的第m个属性的元素,表示第I次迭代中第j个聚类中心的第m个属性的元素,rim表示样本xi的第m个属性的权重,且满足: 其中,不为0;S43中,采用以下公式更新聚类中心: 其中,为更新后的用于第I+1次迭代的第j个聚类中心,为第I次迭代得到的第j个聚类,为第I次迭代得到的第j个聚类的样本个数;S44中,代价函数为: 其中,UI为第I次迭代的代价;终止条件为:|UI+1-UI|γ,其中,γ为收敛极限;S45中,基于k个聚类中心对每个样本进行特征转换,得到包含N个k维列向量的k×N的特征矩阵F,包括:针对每个样本:基于样本xi与k个聚类中心之间的相似度,生成一个k维列向量;组合N个k维列向量,得到k×N的特征矩阵F: 其中,对于k维列向量fi中的第j个特征值fji,i={1,2,…,k},j={1,2,…,N},特征矩阵F的每一行对应一个聚类中心,即一个新的特征,特征矩阵F的每一列对应一个样本;其中,基于样本xi与k个聚类中心之间的相似度,生成一个k维列向量,包括:采用以下公式计算样本xi对应的k维列向量fi中第j个特征值fji: 其中,fji为k维列向量fi中第j个特征值,为样本xi与第j个聚类中心的相似度,为第j个聚类的聚类中心,a为正数,k为聚类总数,为样本xi与第p个聚类中心的相似度;基于计算得到的k个特征值,形成样本xi对应的k维列向量fi。

全文数据:

权利要求:

百度查询: 湖北盈嘉集团有限公司 一种基于大数据的应收账款资料真实性智能识别审核系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。