买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提出一种基于集成的个人所得税异常检测方法,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;采集待检测纳税人的特征数据列表中的特征数据;预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。本发明选用多种算法集成方式提高异常检测性能,能够检测出区别于大多数正常数据的异常数据,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
主权项:1.一种基于集成的个人所得税异常检测方法,其特征在于,包括:S1、基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;S2、基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;S3、采集待检测纳税人的特征数据列表中的特征数据;S4、预处理后的数据,经过基于IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型所集成的综合异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人;步骤S4具体包括:对个人所得税数据共27个特征数据,进行数据预处理,包括缺失值处理,特征数据筛选,利用StandardScaler来进行数据的标准化;输入整理后的特征数据利用孤立森林算法构建异常检测模型,形成检测器G1,对于输入的个人所得税数据,得出每个纳税人的异常程度利用LOF算法进行异常检测分析,形成检测器G2,对于输入的个人所得税数据,得出每个纳税人的异常程度利用OCSVM算法进行异常检测分析,形成检测器G3,对于输入的个人所得税数据,得出每个纳税人的异常程度默认异常程度大于50%为异常,即判定为异常纳税人,同时,异常得分积一分;当异常积分=2时,即两种及以上算法识别为异常纳税人,则该纳税人最终确定为异常纳税人。
全文数据:
权利要求:
百度查询: 河北航天信息技术有限公司 一种基于集成的个人所得税异常检测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。