买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川语言桥信息技术有限公司;西湖大学
摘要:本申请涉及自然语言处理技术领域,为满足跨语言场景下用户以自然语言来方便地对目标语言生成进行多维复合的复杂干预需求,提出了一种基于提示信息的生成跨语言目标文本的方法、系统和介质。所述方法包括由处理器接收用户输入的待生成跨语言文本的源语言文本和给出的提示信息,其中,所述提示信息支持以自然语言的形式表达并包含多种类型的跨语言细粒度控制信息;基于所接收的源语言文本并结合所述提示信息,利用训练好的第一学习模型生成跨语言目标文本以供显示。本申请能够使得用户更方便地提出复合程度更高的细粒度跨语言文本控制要求,并以更高的效率为源语言文本生成更准确、更符合用户控制要求的跨语言目标文本。
主权项:1.一种基于提示信息的生成跨语言目标文本的方法,其特征在于,包括:由处理器接收用户输入的待生成跨语言文本的源语言文本;由处理器接收用户输入的提示信息,其中,所述提示信息支持以自然语言的形式表达,并包含多种类型的跨语言细粒度控制信息,其中,所述跨语言细粒度控制信息的类型包括目标文本长度类、目标文本情感类、目标文本词法类、目标文本句法范围类和目标文本句法模板类;由处理器基于所接收的源语言文本并结合所述提示信息,利用训练好的第一学习模型生成跨语言目标文本以供显示;所述第一学习模型基于源语言文本-跨语言目标文本训练语句对和包含翻译提示信息和跨语言细粒度控制信息的训练提示集而训练得到,具体包括:基于第一分布函数来确定是否为当前训练语句对提供提示信息;在确定要为当前训练语句对提供提示信息的情况下,基于第二分布函数,从各个翻译提示信息的类型和跨语言细粒度控制信息的类型中确定所要采样的提示信息的类型;在各个所要采样的提示信息的类型对应的训练提示集的子集中,分别按照各个类型对应的第三分布函数进行采样,并将从各个子集中采样得到的提示信息的并集作为当前训练语句对的采样提示信息集;利用各个源语言文本-跨语言目标文本训练语句对结合对应该训练语句对的采样提示信息集对所述第一学习模型进行训练。
全文数据:
权利要求:
百度查询: 四川语言桥信息技术有限公司 西湖大学 基于提示信息的生成跨语言目标文本的方法、系统和介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。