买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于异构指针和长变压器模型的企业年报挖掘方法,包括:收集和整理企业年报数据;将收集到的企业年报数据进行预处理,形成txt文件形式,针对得到的txt文本信息打上对应的标签,形成数据集;在txt文本信息的基础上,使用异构指针网络对文本信息进行编码使其可以自动聚焦于对分类有决定性影响的词,以捕捉句子中最重要的语义信息;在语义信息的基础上使用transformerXL网络增强上下文之间的依赖性;为了提高企业年报的分类效果与效率,引入多任务学习的方法,通过分配不同的企业年报数据分类任务的权重进行打分计算,得到具有可解释性的分类效果。
主权项:1.一种基于异构指针和长变压器模型的企业年报挖掘方法,其特征在于,执行以下步骤S1-步骤S4,完成企业年报数据的分类:步骤S1:收集PDF格式的企业年报数据,所收集的企业年报数据的获取途径及信息使用符合相关法律和规定,针对企业年报数据进行预处理,包括Word格式转换、句子划分、排版处理,转换形成txt格式文件;针对得到的txt格式文件打上对应的标签,形成数据集;步骤S2:将txt格式文件中的句子转换为词向量,针对词向量,分别使用BiLSTM网络、指针网络、TextCNN网络提取语义信息,并分别对三个网络的输出进行加权平均,以聚焦于对分类有决定性影响的词,捕捉句子中重要的语义信息;步骤S3:将步骤S2所获得的语义信息输入transformerXL网络,以增强上下文之间的依赖性;步骤S4:针对步骤S3的输出,采用MTL-Att-bert模型进行多任务学习,通过分配不同的企业年报数据的分类任务的权重进行打分计算,获得企业年报数据的分类结果。
全文数据:
权利要求:
百度查询: 南京争锋信息科技有限公司 一种基于异构指针和长变压器模型的企业年报挖掘方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。