基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质

导航：龙图腾网> 最新专利技术> 基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：四川语言桥信息技术有限公司

摘要：本发明属于机器翻译技术领域，提供了一种基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质，其中方法包括：步骤S1：训练一个NMT模型作为预训练模型；步骤S2：将训练集的源语言句子输入NMT模型中，生成n个最佳翻译结果的译文序列,并随机挑选出一个译文序列作为额外的机翻译文mt^；步骤S3：以多任务共享参数的方式对NMT模型进行微调；其中，多任务包括changeunchange分类任务和APE任务，共享参数为NMT模型的编码器参数。采用本发明，能够有效地检测和纠正高质量NMT系统所造成的错误，经测试，TER和BLEU在开发数据集上与baseline模型相比的得分提高了‑2.848和+3.74。

主权项：1.一种基于数据增强和多任务训练改善APE模型的方法，其特征在于，包括：步骤S1：训练一个NMT模型作为预训练模型；步骤S2：将训练集的源语言句子输入NMT模型中，生成n个最佳翻译结果的译文序列,并随机挑选出一个译文序列作为额外的机翻译文mt^；步骤S3：以多任务共享参数的方式对NMT模型进行微调，以此提高APE任务效果；其中，所述多任务包括changeunchange分类任务和APE任务，共享参数为NMT模型的编码器参数；所述步骤S3中微调的具体方法如下：3.1参数初始化：使用NMT模型作为初始模型参数；3.2多任务共享参数设置：将NMT模型中编码器参数用于共享，同时用于训练changeunchange分类任务和APE任务；3.3损失函数定义：针对changeunchange分类任务，使用交叉熵损失函数来计算模型预测结果与真实标签之间的差异；对于APE任务，使用平均绝对误差来度量机器翻译结果与参考答案之间的差异；3.4多任务训练过程：对changeunchange分类任务和APE任务进行迭代训练，在每次训练迭代中，基于训练数据随机选择一个任务进行训练，并根据选择的任务，使用相应的输入数据和损失函数进行训练；1所述步骤S3中的APE任务具体如下：以所述额外的机翻译文mt^作为输入的APE任务；所述1还包括将所述额外的机翻译文mt^用一个特殊的标记送入NMT模型的编码器；2所述步骤S3中的changeunchange分类任务具体如下：训练一个changeunchange分类器，对每一个输入预测的子词token进行change或者unchange的分类预测；所述2中训练changeunchange分类器的具体方法如下：2.1构建训练数据：包括源语言句子src、机器翻译结果mt、额外的机器翻译结果mt^以及后校验译文pe；2.2对训练数据进行词对齐处理；所述2.2的具体方法如下：21对机翻译文mt和后校验译文pe进行词对齐，若单词对齐，则用unchange标记,若单词不对齐，则用change标记；22对额外的机翻译文mt^和后校验译文pe进行词对齐，若单词对齐，则用unchange标记,若单词不对齐，则用change标记；23对训练集的原文src和机翻译文mt做词对齐，若单词对齐，则用unchange标记,若单词不对齐，则就用change标记；2.3多任务共享参数训练：基于所述2.2的训练数据，使用多任务共享参数的方式训练一个changeunchange分类器。

全文数据：

权利要求：

百度查询：四川语言桥信息技术有限公司基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电池耐火防护装置及可行驶设备

下一篇：一种坐浴盆

相关技术

一种电池耐火防护装置及可行驶设备

一种坐浴盆

一种热管理系统及车辆

一种液压潜水泵

一种光纤光栅生命体征监测装置和方法

一种具有抹平结构的高分子胶涂胶设备

一种具有表面清理功能的不锈钢带拉矫装置

水封逆止阀及其使用方法

一种刹车盘保护盖

一种大花海棠染色体加倍的诱导方法

振镜和激光雷达

用于治疗三尖瓣功能不全的系统、方法和装置

方法相关技术

拼接处理方法、显示方法及装置_北京嗨动视觉科技有限公司_202410789924.8

焊接方法_华为技术有限公司_202310265226.3

刻蚀方法_中微半导体设备(上海)股份有限公司_201911358929.0

防滑刹车系统、控制方法、余压故障告警方法及处置方法_成都飞机工业(集团)有限责任公司_202410495891.6

应用风险指数生成方法、模型构建方法、检测方法及设备_武汉安天信息技术有限责任公司_202310222148.9

模具模拟方法、模具补偿设计方法以及模具加工制作方法_中信戴卡股份有限公司_202411020603.8

封装方法_立锜科技股份有限公司_202310232492.6

主动降噪系统及其失稳检测方法、控制方法、设备_宁波方太厨具有限公司_202411080503.4

视频解码方法、视频编码方法和装置_三星电子株式会社_202410898515.1

参考信号的发送方法,接收方法和装置_华为技术有限公司_202310260761.X

改善相关技术

视力改善装置_埃登卢克斯公司_201780061043.2

通过光学衍射改善粒度_马尔文帕纳科_201980017365.6

智能机器人的质量改善方法及系统_珠海采筑电子商务有限公司_202011386079.8

一种用于改善皮肤光老化的制剂_中南民族大学_202411011612.0

用于改善、预防或治疗肌病的组合物_韩国韩医药振兴院_202280090662.5

用于改善齿轮保护的磷抗磨体系_雅富顿化学公司_202210808706.5

改善热轧带钢卷取拉窄的控制方法_上海梅山钢铁股份有限公司_202310218513.9

改善质构的植物鱼豆腐及其制备方法_深圳市星期零食品科技有限公司_202410786800.4

一种土壤肥力改善系统_日照市东港区检验检测中心_202410235156.1

一种改善RA实验背光掉灯装置_广东江粉高科技产业园有限公司_202420190016.2

APE相关技术

基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质_四川语言桥信息技术有限公司_202310819637.2

一种基于链置换的检测miRNA-195和APE1的AND逻辑门生物传感器_济南大学_202410483656.7

基于双足DNA步行器双探针的APE1酶高灵敏检测方法_湖南中医药大学_202410113440.1

一种比率量子点及其在同时检测APE1酶和miRNA-21中的应用、应用方法_湖南中医药大学_202410088205.3

一种基于APE1酶驱动三足DNA Walker检测miRNA-155的可再生电化学生物传感器_北京化工大学_202310881822.4

一种基于FEN1酶驱动的DNA Walker生物传感用于荧光和电化学双模分析APE1酶_北京化工大学_202310881824.3

基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质_四川语言桥信息技术有限公司_202310819637.2

一种高特异性识别APE1的寡核苷酸适配体APT-D1及其制备方法和应用_燕山大学_202111148342.4

基于引物交换反应级联滚环扩增/G四二聚体无标记检测APE1的自反馈荧光生物传感器_重庆医科大学国际体外诊断研究院_202310884993.2

通过新型APE1/REF-1抑制剂靶向于眼部疾病_印第安纳大学研究与技术公司_201980024207.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于数据增强和多任务训练改善APE模型的方法、系统及可读存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务