买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津大学
摘要:本公开提供了一种基于上下文感知学习提升大模型文档级翻译的方法、装置、设备、存储介质和程序产品,可以应用于自然语言处理领域和机器学习领域。该方法包括:获取待翻译文本,待翻译文本包括多个待翻译句,每个待翻译句包括待翻译词;针对每个待翻译句中的M个待翻译词,根据M个翻译词和待翻译文本中的其他待翻译句中的每个其他待翻译词,得到句级注意力;在句级注意力满足预设条件的情况下,将与句级注意力对应的待翻译句确定为关键待翻译句;根据摘要,从平行语料库中确定相似示例对,其中,摘要是将多个保持原始顺序位置的关键待翻译句输入至大模型中得到的;利用大模型处理相似示例对和待翻译文本,得到与待翻译文本对应的目标译文。
主权项:1.一种基于上下文感知学习提升大模型文档级翻译的方法,其特征在于,所述方法包括:获取待翻译文本,其中,所述待翻译文本包括多个待翻译句,每个所述待翻译句包括待翻译词;针对每个所述待翻译句中的M个待翻译词,根据所述M个待翻译词和所述待翻译文本中的其他待翻译句中的每个其他待翻译词,得到句级注意力,其中,M>0;在所述句级注意力满足预设条件的情况下,将与所述句级注意力对应的待翻译句确定为关键待翻译句,其中,所述关键待翻译句包括多个且多个所述关键待翻译句保持原始顺序位置;根据摘要,从平行语料库中确定相似示例对,其中,所述摘要是将多个保持原始顺序位置的所述关键待翻译句输入至大模型中得到的,所述平行语料库包括源文本和与所述源文本对应的源译文,所述源文本包括源句,所述源译文包括源译文句,所述相似示例对包括与所述摘要相匹配的源句,以及与所述相匹配的源句相对应的源译文句;利用所述大模型处理所述相似示例对和所述待翻译文本,得到与所述待翻译文本对应的目标译文。
全文数据:
权利要求:
百度查询: 天津大学 基于上下文感知学习提升大模型文档级翻译的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。