首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于金融大模型的摘要生成方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京熵简科技有限公司

摘要:本发明属于金融数据处理技术领域,公开了一种基于金融大模型的摘要生成方法及系统,所述金融大模型包括:关键句提取模型和摘要生成模型,所述方法包括:获取金融源数据,对金融源数据进行预处理,得到金融文本数据;以金融文本数据作为关键句提取模型的输入,对金融文本数据进行关键句提取,得到若干关键句向量;以若干关键句向量作为摘要生成模型的输入,对若干关键句向量进行压缩,得到文本摘要;其中,所述摘要生成模型为以卷积神经网络作为基本单元的序列模型。本发明能迅速分析和抽取不同文档的关键句子,减少噪声信息的影响;本发明以卷积神经网络作为基本单元的摘要生成模型,不仅能实现模型的并行训练,提高摘要生成模型的训练效率。

主权项:1.一种基于金融大模型的摘要生成方法,其特征在于,所述金融大模型包括:关键句提取模型和摘要生成模型,所述方法包括:获取金融源数据,对金融源数据进行预处理,得到金融文本数据;以金融文本数据作为关键句提取模型的输入,对金融文本数据进行关键句提取,得到若干关键句向量;以若干关键句向量作为摘要生成模型的输入,对若干关键句向量进行压缩,得到文本摘要;其中,所述摘要生成模型为以卷积神经网络作为基本单元的序列模型;所述关键句提取模型为图模型;以金融文本数据作为关键句提取模型的输入,对金融文本数据进行关键句提取,得到若干关键句向量,包括:基于图模型将金融文本数据转换为拓扑图结构,所述拓扑图结构中包括若干节点,每一节点用于表征金融文本数据中的一个句子;计算每两个节点之间的句子距离和语义距离,根据句子距离和语义距离确定每两个节点之间相似度;任意两个节点之间的相似度的函数表达式为: ;式中,为第i个节点与第j个节点之间的相似度,为相似权重,为第i个节点与第j个节点之间的语义距离,为第i个节点与第j个节点之间的句子距离,为第i个节点上的句子向量,为第j个节点上的句子向量;其中,第i个节点与第j个节点之间的句子距离用于表征第i个节点上的句子向量转换为第j个节点上的句子向量所需要的转换操作次数;其中,所述转换操作包括:删除操作、插入操作和替换操作中的一种或多种组合;根据任意两个节点之间相似度,确定任意两个节点之间的边权重;根据每两个节点之间的边权重,确定每个节点的重要度分值;根据每个节点的重要度分值从拓扑图结构中提取句子,并以提取出的句子在金融文本数据中所处的位置进行排序,得到若干关键句子;对若干关键句子进行向量化,得到若干关键句向量。

全文数据:

权利要求:

百度查询: 北京熵简科技有限公司 一种基于金融大模型的摘要生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。