Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜语联网(武汉)信息技术有限公司张文博获国家专利权

恭喜语联网(武汉)信息技术有限公司张文博获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜语联网(武汉)信息技术有限公司申请的专利一种基于记忆库的机器翻译模型训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114492474B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210047697.2,技术领域涉及:G06F40/58;该发明授权一种基于记忆库的机器翻译模型训练方法是由张文博设计研发完成,并于2022-01-17向国家知识产权局提交的专利申请。

一种基于记忆库的机器翻译模型训练方法在说明书摘要公布了:本发明公开了一种基于记忆库的机器翻译模型训练方法,包括如下步骤:S1、基于目标语言检索生成三元组训练数据;S2、基于去噪语言模型生成三元组训练数据;S3、基于生成的三元组训练数据训练机器翻译模型。本发明先利用基于去噪语言模型生成三元组训练数据训练得到机器翻译预训练模型,再利用基于目标语言检索生成三元组训练数据去微调得到机器翻译训练模型,保证机器翻译训练模型的精确性,提高工作效率和翻译质量。

本发明授权一种基于记忆库的机器翻译模型训练方法在权利要求书中公布了:1.一种基于记忆库的机器翻译模型训练方法,其特征在于,包括如下步骤:S1、基于目标语言检索生成三元组训练数据:S1.1、获取平行语料的目标单语数据,所述目标单语数据中的任一句子记作Ti;S1.2、选取平行语料中的某个句对Sa,Ta,计算出目标语言句子Ta和所述目标单语数据中的每个句子Ti的相似度simTa,Ti,其中相似度simTa,Ti计算公式如下所示: 公式1中,Ta为平行语料中当前待匹配的目标语言句子,Ti是目标单语数据中的任一个句子,distTa,Ti表示Ta和Ti的编辑距离,max|Ta|,|Ti|表示Ta和Ti两个句子长度的较大值,simTa,Ti表示Ta和Ti的相似度;S1.3、设定阈值,将目标单语数据中相似度最大的句子与阈值作比较:若相似度大于阈值,则该目标单语数据中相似度最大的句子与平行语料中的一个句对Sa,Ta组合形成Sa,Ta,Tb;S1.4、对平行语料中的其余句对按照S1.2和S1.3步骤组合,得到基于目标语言检索的三元组训练数据;S2、基于去噪语言模型生成三元组训练数据:S2.1、获取目标单语数据中的任一句子Tx;S2.2、将任一句子Tx进行加噪,得到加噪后的句子记作Ty;S2.3、将加噪前的任一句子Tx和加噪后的句子Ty组合成Tx,Ty;S2.4、将目标单语数据的其余句子按照S2.2和S2.3步骤加噪、组合,构成去噪语言训练数据组;S2.5、利用去噪语言训练数据组训练一个去噪语言模型LM,其中Ty为模型输入,Tx为模型标签;S2.6、对平行语料中某个句对Sa,Ta的目标语言句子Ta按照步骤S2.2进行加噪,得到加噪后的句子Tay;S27、将加噪后的句子Tay作为训练得到的去噪语言模型LM的输入,利用去噪语言模型LM输出得到对应的预测句子,记作Tax;S2.8、将预测句子Tax和所述句对Sa,Ta组合,形成Sa,Ta,Tax;S2.9、对平行语料中的其余句对按照S2.6、S2.7和S2.8步骤加噪、去噪,得到基于去噪语言模型生成的三元组训练数据;S3、基于生成的三元组训练数据训练机器翻译模型,包括:S3.1、利用基于去噪语言模型生成的三元组训练数据Sa,Ta,Tax中的Sa和Tax拼接成一个句子Sin;S3.2、利用Sin和Ta训练一个机器翻译预训练模型MTpre,其中Sin为模型输入,Ta作为模型标签;S3.3、利用目标语言检索生成三元组训练数据Sa,Ta,Tb中的Sa和Tb拼接成一个句子Sim;S3.4、将Sim为输入,Ta作为标签,继续微调机器翻译预训练模型MTpre,得到最终基于记忆库的机器翻译模型MT。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语联网(武汉)信息技术有限公司,其通讯地址为:430000 湖北省武汉市武汉东湖新技术开发区高新大道999号未来科技城B2栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。