一种基于深度交叉网络的机器译文自动评价方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江西师范大学

摘要：本发明公开一种基于深度交叉网络的机器译文自动评价方法，步骤为：获取训练集，对训练集进行规范化处理；提取独立表征模式下句子级别机器译文质量特征向量；提取统一表征模式下句子级别机器译文质量特征向量；提取机器译文质量交叉特征向量；预测机器译文质量；训练基于深度交叉网络的机器译文自动评价模型。预测方法步骤为；将机器译文与人工参考译文输入上述基于深度交叉网络的机器译文自动评价模型预测机器译文质量；同时采用大语言模型向量数据库直接对机器译文和人工参考译文进行句向量表征，计算机器译文与人工参考译文的余弦相似度，将预测的机器译文质量与余弦相似度线性加权获取机器译文质量的分值。

主权项：1.一种基于深度交叉网络的机器译文自动评价方法，其特征在于：步骤如下：步骤S1，获取训练集，对训练集进行规范化处理，获得规范化处理后的训练集；训练集由多个不同样本组成，每个样本包括机器译文、人工参考译文和机器译文的人类评价分值；步骤S2，提取独立表征模式下句子级别机器译文质量特征向量；将规范化处理后的训练集内每个样本中机器译文和人工参考译文，分别输入到跨语言预训练模型，输出独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，将独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量使用外部注意力机制进行交互得到独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，连接独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，并进行平均池化操作，输出独立表征模式下句子级别机器译文质量特征向量；步骤S3，提取统一表征模式下句子级别机器译文质量特征向量；将规范化处理后的训练集内每个样本中机器译文和人工参考译文进行字符串相连得到译文联合字符串，将译文联合字符串输入到跨语言预训练模型，输出统一表征模式下子词级别特征向量，将统一表征模式下子词级别特征向量使用自注意力机制进行交互，得到统一表征模式下交互特征向量，将统一表征模式下交互特征向量进行平均池化操作，输出统一表征模式下句子级别机器译文质量特征向量；步骤S4，提取机器译文质量交叉特征向量；将步骤S2中独立表征模式下句子级别机器译文质量特征向量和步骤S3中统一表征模式下句子级别机器译文质量特征向量拼接，输入到含有4个堆叠交叉层的深度交叉网络，输出机器译文质量交叉特征向量；步骤S5，预测机器译文质量；将步骤S4中机器译文质量交叉特征向量输入三层前馈神经网络，输出机器译文质量分值；步骤S6，训练基于深度交叉网络的机器译文自动评价模型；根据步骤S5中输出的机器译文质量分值和步骤S1中规范化处理后的训练集内机器译文的人类评价分值，通过最小化在规范化处理后的训练集上的均方差损失来训练基于深度交叉网络的机器译文自动评价模型的参数，得到训练后的基于深度交叉网络的机器译文自动评价模型；步骤S2中提取独立表征模式下句子级别机器译文质量特征向量，具体为：步骤S21，将机器译文h和人工参考译文r分别输入到跨语言预训练模型XLM-RoBERTa，由跨语言预训练模型XLM-RoBERTa使用子词切分方法SentencePiece算法对机器译文h和人工参考译文r进行子词切分，分别得到包含m个子词和n个子词的子词序列：；其中，m和n分别表示机器译文和人工参考译文使用子词切分方法SentencePiece算法切分后包含的子词个数；h1，h2，hm表示机器译文使用子词切分方法SentencePiece算法切分后的第1个子词，第2个子词，第m个子词；r1，r2，rn表示人工参考译文切分后的第1个子词，第2个子词，第n个子词；步骤S22，跨语言预训练模型XLM-RoBERTa根据子词和子词在句子中的位置输出独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，如公式（1）和公式（2）所示； 1； 2；其中，vh和vr分别表示机器译文和人工参考译文使用跨语言预训练模型XLM-RoBERTa输出的独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，XLM-RoBERTa•表示跨语言预训练模型XLM-RoBERTa；步骤S23，将独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量,使用外部注意力机制进行交互，得到独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，如公式（3）和公式（4）所示： 3； 4；其中，为独立表征模式下机器译文交互特征向量，为独立表征模式下人工参考译文交互特征向量；MultiHead•表示多头注意力机制函数，多头注意力机制函数中包含查询、键和值三个参数，当查询与键和值不相同时多头注意力机制转化为外部注意力机制；步骤S24，连接独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，并进行平均池化操作，输出独立表征模式下句子级别机器译文质量特征向量如公式（5）所示： 5；其中，vshr表示独立表征模式下句子级别机器译文质量特征向量；AvgPooling表示平均池化操作；步骤S3中提取统一表征模式下句子级别机器译文质量特征向量，具体为：步骤S31，将机器译文h和人工参考译文r进行字符串相连得到译文联合字符串，如公式（6）所示： 6；其中，hr为译文联合字符串，“s”表示字符串的起止符；步骤S32，将译文联合字符串输入跨语言预训练模型XLM-RoBERTa，由跨语言预训练模型XLM-RoBERTa使用子词切分方法SentencePiece算法对译文联合字符串进行子词切分，得到包含p个子词的子词序列，如公式（7）所示： 7；其中，p表示译文联合字符串使用子词切分方法SentencePiece算法子词切分后包含的子词个数；hr1，hr2，hrp表示译文联合字符串使用SentencePiece算法切分后的第1个子词，第2个子词，第p个子词；步骤S33，跨语言预训练模型XLM-RoBERTa根据子词和子词在句子中的位置输出统一表征模式下子词级别特征向量，如公式（8）所示： 8；其中，vhr表示统一表征模式下子词级别特征向量；步骤S34，将统一表征模式下子词级别特征向量使用自注意力机制进行交互得到统一表征模式下交互特征向量，如公式（9）所示： 9；其中，表示统一表征模式下交互特征向量，MultiHead•表示多头注意力机制函数，多头注意力机制函数中包含查询、键和值三个参数，当查询与键和值相同时多头注意力机制转化为自注意力机制；步骤S35，将统一表征模式下交互特征向量进行平均池化操作，输出统一表征模式下句子级别机器译文质量特征向量，如公式（10）所示： 10；其中，vuhr表示统一表征模式下句子级别机器译文质量特征向量。

全文数据：

权利要求：

百度查询：江西师范大学一种基于深度交叉网络的机器译文自动评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电信网元实时处理方法、装置、设备、介质及程序产品

下一篇：路径规划方法、系统、设备及计算机可读存储介质

相关技术

电信网元实时处理方法、装置、设备、介质及程序产品

路径规划方法、系统、设备及计算机可读存储介质

塔式光热发电背板冲压平直度仿真模拟评价方法

一种内陆区域地下水封洞设计水位的确定方法

适用于不同功能空间声场控制的音频处理系统及方法

马达

一种玻璃瓶裂纹检测装置

一种动态自由视点图像合成方法、系统、设备及存储介质

ZnO/石墨烯复合材料、Zn杂化石墨烯阻燃环氧丙烯酸酯涂层及制备方法

一种1-溴乙基乙酸酯的制备方法

一种膨化食品加工用粉碎装置

叔丁醇的制造方法

译文相关技术

法语译文质量自动化评估方法、系统、设备及存储介质_浙江科技大学_202411207282.2

翻译文本修订方法、装置、计算机设备和存储介质_文思海辉智科科技有限公司_202010909502.1

一种基于大语言模型的机器译文质量估计方法_华东交通大学_202410871902.6

一种基于深度交叉网络的机器译文自动评价方法_江西师范大学_202410872045.1

一种翻译文本生成方法、装置、存储介质及电子设备_深圳市三六零智慧生活科技有限公司_202410611069.1

基于译文树结构解码路径动态选择的机器翻译方法_厦门大学_202111063749.7

一种基于大语言模型的机器译文质量估计方法_华东交通大学_202410871902.6

一种基于深度交叉网络的机器译文自动评价方法_江西师范大学_202410872045.1

翻译文件的生成方法、装置、电子设备、存储介质及产品_腾讯科技(深圳)有限公司_202310143807.X

用于翻译文档的方法及相关设备_北京字跳网络技术有限公司_202410520210.7

机器相关技术

机器人传动机构及机器人_深圳市优必选科技股份有限公司_202420530721.2

缝合机器人_江苏风和医疗器材股份有限公司_202310547460.5

清洁机器人_深圳银星智能集团股份有限公司_202010921653.9

机器人抄手_无锡雅佳智能节能科技有限公司_202420552030.2

作业机器人_中联重科股份有限公司_202410391533.0

巡检机器人_汪小鹏_202110467625.9

巡检机器人_深圳优艾智合机器人科技有限公司_202323512148.7

清洁机器人_元鼎智能创新(国际)有限公司_202420036959.X

球形机器人_重庆理工大学_202420707862.7

清洁机器人_深圳库犸科技有限公司_202420595293.1

网络相关技术

基于受观测网络流的网络变更验证_亚马逊科技公司_202380032153.1

用于多链路设备网络的网络译码_高通股份有限公司_202380029846.5

接入节能网络_联想(北京)有限公司_202280094483.9

网络层异质性_高通股份有限公司_202380030670.5

医疗保健网络_西门子医疗股份公司_202011042329.6

管理电信系统的无线电接入网络中的网络元素_意大利电信股份公司_202380031271.0

基于网络摄像头的网络连接稳定性测试方法及系统_视云(深圳)智能技术有限公司_202410880795.3

软件定义网络控制器网络及其交互方法和存储介质_中国电信股份有限公司_202110339592.X

基于指针网络与遗传算法的安全测试路由节点网络边选择方法_湖南大学_202411236391.7

用于在云网络中传输数据的方法、装置和云网络系统_北京百度网讯科技有限公司_202411230753.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度交叉网络的机器译文自动评价方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务