买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京审计大学
摘要:本发明公开一种财务舞弊线索的动态识别方法,构建并训练财务舞弊审计线索动态识别模型,财务舞弊审计线索动态识别模型包括财务舞弊识别模型、舞弊因子提取模型和舞弊因果图模型;财务舞弊识别模型基于随机森林方法对数据进行舞弊识别,并筛选出核心财务舞弊特征;舞弊因子提取模型基于核心财务舞弊特征采用RuleFit算法提取舞弊因子,并对舞弊因子筛选得到核心舞弊因子集;舞弊因果图模型以核心舞弊因子集为基础,构建财务舞弊因果图,并通过贝叶斯因果分析算法萃取舞弊知识。本发明能够在识别财务舞弊的同时提取舞弊因子以反映财务舞弊风险,并形成财务舞弊因子的风险散点图,帮助审计人员快速定位高风险的舞弊因子,并通过对舞弊因子的分析,为审计人员提供审计线索。
主权项:1.一种财务舞弊线索的动态识别方法,其特征在于,包括以下步骤:步骤1、获取上市公司数据和证监会处罚数据;步骤2、构建并训练财务舞弊审计线索动态识别模型ACDD,所述财务舞弊审计线索动态识别模型ACDD包括财务舞弊识别模型FD、舞弊因子提取模型FFE和舞弊因果图模型FCG;步骤2.1、构建财务舞弊识别模型FD,通过财务舞弊识别模型利用随机森林算法对收集的上市公司样本进行舞弊识别,筛选出核心财务舞弊特征;具体方法为:首先,选取上市公司数据为样本空间范围,从财务报表中获得财务与非财务特征,构建特征变量空间;从证监会处罚数据中获得标记为1的财务舞弊样本和标记为0的财务非舞弊样本,形成标签空间;然后,对财务舞弊样本和财务非舞弊样本进行去噪和平衡处理,将处理后的财务舞弊样本和财务非舞弊样本混合后划分训练集与测试集;接着,构建基于随机森林RF算法的财务舞弊识别模型FD,通过RFE特征降维方法选取部分重要特征,使用K-折交叉验证的网格搜索选取最佳超参数对财务舞弊识别模型进行训练;最后,使用预训练好的财务舞弊识别模型对训练集中的样本进行预测,预测输出标注为1的财务舞弊样本或标注为0的财务非舞弊样本,同时评估财务舞弊识别模型FD的性能以及筛选核心舞弊特征;步骤2.2、基于步骤1所得核心舞弊特征使用Rulefit算法构建舞弊因子提取模型FFE,通过舞弊因子提取模型提取舞弊因子,并学习舞弊因子的权重以及筛选出核心舞弊因子,得到核心舞弊因子集;具体方法为:首先、将特征空间中的所有特征变量细分为六个特征变量类别:资产类、负债类、权益类、利润类、现金流量类和非财务类,基于FD模型输出的特征变量重要度评分对所有特征变量进行排序,在每个特征变量类别中选择重要度评分最高的前10个特征变量,并将重要度评分在前50位但并未在上一步被选择的特征变量纳入选择作为用于舞弊因子提取的数据集;然后、调整超参数max_depth的值为8,使用步骤2.1模型所选核心财务舞弊特征与本步骤新选特征重新训练基于随机森林的财务舞弊识别模型FD;其次、使用Rulefit算法从财务舞弊识别模型FD中提取规则作为舞弊因子,规则由判断条件及其所对应特征组成;接着、使用Lasso回归算法来实现舞弊因子的初步筛选,将所有舞弊因子对舞弊标签进行线性拟合,系数大于0的舞弊因子表示对舞弊行为的影响为正,剔除了系数小于与等于0的舞弊因子;最后、通过舞弊因子的支持度Sj与置信度Cj来计算舞弊因子的重要度分数Ij,将前15个对应重要度分数Ij值较大的舞弊因子纳入核心舞弊因子集;步骤2.3、对于步骤2所得核心舞弊因子集,利用NOTEARS算法和MLE算法构建舞弊因果图模型FCG,通过舞弊因果图模型FCG得到财务舞弊因果图,基于财务舞弊因果图通过贝叶斯因果分析算法萃取舞弊知识;具体方法为:首先、采用NOTEARS算法依据核心舞弊因子集中的15个舞弊因子来学习因果图结构,构建出一个反映显著因果关系的有向无环图,即财务舞弊因果图,财务舞弊因果图中的节点代表舞弊因子或财务舞弊标签,边则表示节点间的因果关系;然后、选择极大似然估计MLE对财务舞弊因果图中的因果关系进行定量描述,确定财务舞弊因果图中每个节点的条件概率分布;接着、使用逆向推理,即在已知或假定舞弊因果图模型FCG中某个或某些舞弊因子处于发生的状态,并将这些结果作为先验证据输入,分析可能导致该结果发生的舞弊因子组合;此处所述结果不局限于财务舞弊标签,而是舞弊因果图模型FCG中的任何舞弊因子均作为先验证据;最后、使用敏感性分析,即通过变化舞弊因果图模型FCG中某个舞弊因子的状态,观察该舞弊因子对财务舞弊标签的概率分布的影响,以评估不同舞弊因子的敏感性;步骤3、使用训练好的财务舞弊审计线索动态识别模型ACDD对某公司数据进行动态识别,具体方法为:获取该公司的财务数据和其他相关信息,先将数据样本输入财务舞弊识别模型FD,由财务舞弊识别模型FD对公司数据进行分析和评估是否存在舞弊;如果财务舞弊识别模型FD的识别结果表明公司数据中没有舞弊风险,则分析流程结束,若存在舞弊风险,则将数据样本标注为财务舞弊样本;然后将所有财务舞弊样本依次输入舞弊因子提取模型FFE和舞弊因果图模型FCG,更新舞弊因子与因果图;最后使用PDCA循环的方法,不断更新财务舞弊识别模型FD、舞弊因子提取模型FFE和舞弊因果图模型FCG,持续地进行改进。
全文数据:
权利要求:
百度查询: 南京审计大学 一种财务舞弊线索的动态识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。