买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国烟草总公司四川省公司
摘要:本申请公开了基于机器学习的财务数据的信息提取系统、税利预测系统。涉及人工智能技术领域,包括财务数据收集模块,收集每一项财务数据,并生成对应的流水号;业务数据收集模块,收集每一项业务数据;数据清洗模块,将每笔业务数据和财务数据记录于同一个流水号下,以生成融合数据;数据收集模块,得到融合数据库;数据处理模块,得到融合数据库的关联度矩阵。本申请所提供的技术方案中,在预测未来一段时间的财务指标时,降低频繁数据集出现的次数,进而数据预测模块再利用数据来预测未来一段时间内的财务指标时,提高财务指标的生成效率。
主权项:1.基于机器学习的财务数据的信息提取系统,其特征在于,包括:财务数据收集模块,用于收集每一项财务数据,并给每项财务数据生成对应的流水号;业务数据收集模块,用于收集每一项业务数据;数据清洗模块,将每笔业务数据与财务数据对应,使得每笔业务数据和财务数据记录于同一个流水号下,以生成融合数据;数据收集模块,收集每项融合数据,得到融合数据库;数据处理模块,从融合数据库中提取出财务信息矩阵和业务信息矩阵,并按照时间序列对融合数据库中的各项融合数据进行关联度提取得到关联度矩阵;数据处理模块包括:财务数据处理单元、业务数据处理单元,以及关联度处理单元;财务数据处理单元从融合数据库中提取出财务信息矩阵;业务数据处理单元从融合数据库中提取出业务信息矩阵,业务信息矩阵和财务信息矩阵中对应位置的业务数据和财务数据的流水号相同;关联度处理单元与融合数据库信号连接,用于计算各业务数据的关联度,得到业务数据的关联度矩阵;关联度处理单元采用如下步骤计算关联度矩阵:S1:读取融合数据库中每项融合数据的时间标签,按照时间间隔顺序的将融合数据库划分为若干个子数据库M1、M2、…Mi…;M1表示第1个子数据库,M2表示第2个子数据库,Mi表示第i个子数据库,i表示子数据库的索引;S2:读取子数据库中的每项融合数据,根据每项融合数据的数据类进行矩阵化,得到融合数据库的数字矩阵M; ;其中,m1,1为第1个子数据库中第1项数据类,m1,n为第1个子数据库中第n项数据类,n表示数据类的种类;mk,1为第k个子数据库中的第1项数据类,mk,n为第k个子数据库中第n项数据类,k表示子数据库的数量;在数字矩阵M中存在对应数据类则记作1,未存在对应数据类则记作0;S3:计算数字矩阵M中各数据类的关联度Lo, ;其中,o表示数据类的索引,i表示子数据库的索引,SLo表示第o项数据类在所有的子数据库中出现的关联度;S4:将数字矩阵M中任意两列连接起来,生成新的频繁候选项集Qop,o和p分别为数据类的索引,o≠p; ;计算连接后的频繁候选项集的关联度SQop; ;S5:从第1项数据类开始用当前的前列向量,依次与后续向量相交求取新的向量,以得到关联度矩阵D; 。
全文数据:
权利要求:
百度查询: 中国烟草总公司四川省公司 基于机器学习的财务数据的信息提取系统、税利预测系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。