一种结合对比学习和预训练技术的中文新闻文本摘要方法

导航：龙图腾网> 最新专利技术> 一种结合对比学习和预训练技术的中文新闻文本摘要方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学

摘要：本发明提出一种结合对比学习和预训练技术的中文新闻文本摘要方法，包括1构建对比学习输入数据；2使用结合中文新闻语料微调后的BERT预训练模型获取新闻文本的上下文向量表示，对文本中的句子进行分类打分，抽取包含关键信息的候选句得到候选句集合；3将候选句集合输入到结合中文新闻语料微调后的MT5模型中，生成摘要结果；4结合AECLoss损失函数实现抽取式模型、生成式模型的端到端训练。本发明能够结合对比学习获取更忠于原文内容的摘要结果；通过结合外部知识，提升预训练模型在新闻文本上的语义表示能力；通过先抽取后生成的摘要方式，使模型充分关注新闻文本中的关键内容，有效提升了模型的可解释性和摘要结果的连续性、可读性。

主权项：1.一种结合对比学习和预训练技术的中文新闻文本摘要方法，其特征在于，包括以下步骤：1使用回译、实体替换的方式构建对比学习输入数据；2使用结合中文新闻语料调整后的BERT预训练模型获取新闻文本的上下文向量表示，对文本中的句子进行分类，抽取得到候选句集合；所述对文本中的句子进行分类表示具体为：a将利用BERT预训练模型获取的上下文向量h输入到Bi-LSTM中，进一步提取上下文的语义信息，具体计算公式为：和表示正向GRU和反向GRU在t时刻的隐层状态向量，分别由当前时刻的输入向量xt及当前方向上一时刻的隐层状态向量ht-1、ht+1得到；将和拼接后得到当前时刻隐层状态向量ht；ht包含了两个方向上的隐层状态；b利用Bi-LSTM进一步文本获取更高维度的语义信息后，将句向量集合送入到全连接层，判断当前句子是否为候选句；模型结合对比学习，采用损失函数Lext-CL作为抽取式摘要模型的损失函数，具体计算公式如下：其中计算正例对负例对的相似度，τ为温度系数，决定对比损失对困难负样本的关注程度；3使用抽取得到的候选句集合输入到结合中文新闻语料调整后的MT5预训练模型中，生成摘要结果；所述生成摘要结果中，模型解码部分引入coverage机制，具体包括：a模型在t时刻引入追踪向量ct，追踪已生成的单词，对已生成的单词添加惩罚系数，避免生成过多的文本冗余内容，具体计算公式为：ct＝∑t‘at‘17b模型结合追踪向量后，新的注意力权重分布a_newt计算公式为：p_newti＝zTtanhH5hi+H6st+H7catcht+v518a_newt＝soiftmaxp_newti19其中z、H5、H6、H7、v5是计算注意力权重时的超参数；c生成式摘要模型目标损失及coverage机制损失函数计算方法如下： Py|x1,x2,…,xn表示在x1,x2,…,xn已经出现的条件下，生成y的概率；T已经表示所有时刻，minat,ct用来获取t时刻注意力权重at和t时刻coverage机制得分ct的较小值；4结合提出的AECLoss损失函数实现抽取式模型、生成式模型的端到端训练；具体包括：结合公式11中的抽取式模型损失函数Lext-CL、公式20中的生成式模型损失函数Labs和公式21中的coverage机制损失函数Lcov计算得到AECLoss损失函数；AECLoss＝α1Lext-CL+α2Labs+α3Lcov22α1、α2、α3为模型训练得到的参数。

全文数据：

权利要求：

百度查询：大连理工大学一种结合对比学习和预训练技术的中文新闻文本摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种服装生产加工用压烫机

下一篇：图像处理方法、装置、电子设备及存储介质

相关技术

一种服装生产加工用压烫机

图像处理方法、装置、电子设备及存储介质

高效固件测试

一种骨科导针导向装置

基于消防物联网的调度控制平台

一种口罩总泄漏率检测仪

一种具有清洁组件的制袋机自动放卷设备

导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

烹饪设备

一种底部卸料箱

一种墙体保温工程预制构件及其快速组装方法

散热器及具有该散热器的燃料电池冷却系统

中文相关技术

类C语言中文编程控制器_林家明_202410959234.2

基于单字连接的文档图像中文字符检测方法_复旦大学_202210407860.1

基于LSTM的中文地址分词方法、系统、计算机设备及介质_平安银行股份有限公司_202410747380.9

一种中文命名实体识别方法及系统_山东师范大学_202111617535.X

一种结合对比学习和预训练技术的中文新闻文本摘要方法_大连理工大学_202210623480.1

一种基于图注意力网络的中文短文本分类方法_电子科技大学_202410907715.9

一种中文议论文智能批改方法及系统_北京华图宏阳网络科技有限公司_202011631779.9

一种基于多模态软提示学习的中文点击诱饵检测方法_扬州大学_202410884762.6

一种手写中文字库生成方法、系统、电子设备和存储介质_北京汉仪创新科技股份有限公司_202210752549.0

一种动态融合词典信息的中文命名实体识别方法和装置_南京航空航天大学_202111260751.3

技术相关技术

波束故障恢复技术_高通股份有限公司_202411064372.0

多层传输技术_瑞典爱立信有限公司_202080014333.3

用于处理设备中多个无线电接入技术组件的共存的技术_高通股份有限公司_202080013367.0

高频音频重建技术的集成_杜比国际公司_202411156478.3

高频音频重建技术的集成_杜比国际公司_202411156370.4

高频音频重建技术的集成_杜比国际公司_202411156714.1

用于无线接入技术的传输设计_苹果公司_202411111249.X

用于搜索空间管理的技术_高通股份有限公司_201980060370.5

高频音频重建技术的集成_杜比国际公司_202411156425.1

用于多个PRACH发送的技术_高通股份有限公司_202280092600.8

新闻相关技术

基于多级图文语义对齐模型的新闻事件搜索方法及系统_北京邮电大学_202111413975.3

一种结合对比学习和预训练技术的中文新闻文本摘要方法_大连理工大学_202210623480.1

一种面向不平衡样本的假新闻检测方法_吉林大学_202410878678.3

基于人工智能的新闻处理方法以及相关装置_珠海传媒融创科技有限公司_202411219517.X

一种便于收纳的新闻传播用提词器_西北政法大学_202420086253.4

多模态虚假新闻检测方法、装置、设备及介质_武汉大学_202411249513.6

一种基于视觉成像技术识别网页内新闻链接的方法和系统_兰州创星信息科技有限公司_202410681583.2

一种新闻特征向量的构建方法及应用_西交利物浦大学_201910397143.3

一种基于人工智能的新闻数据的治理及浏览方法_苏州日报社_202410902543.6

一种粤语新闻视频中自动裁剪含主播的视听数据集的方法_东南大学_202211132338.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种结合对比学习和预训练技术的中文新闻文本摘要方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务