首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种适用于机器翻译的句子改写切分方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中译语通科技(昆明)有限公司

摘要:本发明属于机器翻译技术领域,公开了一种基于大语言模型的适用于机器翻译的句子改写切分方法,本发明将文本切分任务转换为改写任务,借助大语言模型包含的丰富的语言学知识进行高质量的文本改写与切分,在保证文本内容完整性的前提下优化了后续机器翻译阶段的输入文本,提高了翻译效率与正确率。相比现有的从句终标点符号出发的方法,本模型从文本改写的角度出发,直接令大模型对输入文本进行改写切分,故其断句位置不仅局限于句终标点的位置,增加了切分的灵活性;通过要求改写切分模型的输出保存原始句子的内容信息,约束了模型的改写力度,保证了原始信息的完整性。对于本就不包含标点符号系统的语种,此类文本改写的切分方式同样适用。

主权项:1.一种基于大语言模型的适用于机器翻译的句子改写切分方法,其特征在于,包括以下步骤:步骤一,在改写任务的数据准备阶段,使用设计好的提示模板组织原始语料,在提示词中限定改写结果的单句长度、总单句数、文本风格,将原始数据转变为适用于改写任务的改写数据集;步骤二,在不影响改写前后内容一致性的前提下利用改写数据集对大语言基座模型进行文本改写方面的专门微调,利用步骤一中各类改写数据增强输出结果的多样性、流利性、准确度、丰富度,得到大语言改写模型;步骤三,利用微调好的大语言改写模型对输入文本进行改写,切分的句子数量及各个单句的长度可通过设置输入大语言改写模型的指令进行定义;改写后,在各单句位置进行切分,得到长度符合后续机器翻译模型输入要求的切分结果并交付。

全文数据:

权利要求:

百度查询: 中译语通科技(昆明)有限公司 一种适用于机器翻译的句子改写切分方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。