一种基于大语言模型的机器译文质量估计方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华东交通大学

摘要：本发明公开一种基于大语言模型的机器译文质量估计方法，其方法步骤为：提取源语言句子至机器译文的相似度特征向量和机器译文至源语言句子的相似度特征向量，提取机器译文质量估计特征向量，预测机器译文质量得分；最小化均方差损失和交叉熵损失的总和来训练模型中的参数。本发明结合大语言模型这两方面的特点，将大语言模型对机器译文和源语言句子的表征输入引入辅助分类任务的神经网络中预测机器译文质量；同时由大语言模型进行翻译生成伪参考译文，使用伪参考译文代替人工参考译文采用机器译文自动评价方法进行译文质量评价，将两者相结合预测机器译文质量。

主权项：1.一种基于大语言模型的机器译文质量估计方法，其特征在于：步骤如下：步骤S1，获取训练集，对训练集进行规范化处理，获得规范化处理后的训练集；训练集由多个不同样本组成，每个样本包括源语言句子、机器译文、机器译文的人类评价分值、机器译文的人类评价类别；步骤S2，提取源语言句子至机器译文的相似度特征向量；将规范化处理后的训练集内每个样本中的源语言句子和机器译文顺序相连，输入到大语言模型，输出源语言句子至机器译文的子词级别特征向量，提取源语言句子至机器译文的子词级别特征向量的最后一个子词的特征向量作为源语言句子至机器译文的相似度特征向量；步骤S3，提取机器译文至源语言句子的相似度特征向量；将规范化处理后的训练集内每个样本中的机器译文和源语言句子顺序相连，输入到大语言模型，输出机器译文至源语言句子的子词级别特征向量，提取机器译文至源语言句子的子词级别特征向量的最后一个子词的特征向量作为机器译文至源语言句子的相似度特征向量；步骤S4，提取机器译文质量估计特征向量；将步骤S2中源语言句子至机器译文的相似度特征向量和步骤S3中机器译文至源语言句子的相似度特征向量拼接后输入到机器译文质量估计任务适配器层，输出机器译文质量估计特征向量；步骤S5，预测基于大语言模型深度表征的机器译文质量得分；将步骤S4中机器译文质量估计特征向量输入到主回归网络层，预测基于大语言模型深度表征的机器译文质量得分；步骤S6，预测基于大语言模型深度表征的机器译文质量类别；将步骤S4中机器译文质量估计特征向量输入到辅助分类网络层，预测基于大语言模型深度表征的机器译文质量类别；步骤S7，训练基于大语言模型深度表征的机器译文质量估计模型；根据步骤S5中预测的基于大语言模型深度表征的机器译文质量得分和步骤S1中规范化处理后的训练集内机器译文的人类评价分值，计算在训练集上的均方差损失；根据步骤S6中预测的基于大语言模型深度表征的机器译文质量类别和步骤S1中规范化处理后的训练集内机器译文的人类评价类别，计算在训练集上的交叉熵损失；线性加权在训练集上的均方差损失和在训练集上的交叉熵损失作为在训练集上的总损失，最小化在训练集上的总损失来训练基于大语言模型深度表征的机器译文质量估计模型的参数，得到训练后的基于大语言模型深度表征的机器译文质量估计模型；步骤S8，对源语言句子、机器译文进行规范化处理后输入至步骤S7中训练后的基于大语言模型深度表征的机器译文质量估计模型，预测基于大语言模型深度表征的机器译文质量得分；步骤S9，利用提示使用大语言模型进行机器翻译生成源语言句子的伪参考译文；编制提示与源语言句子相连形成翻译指令，在对话模式下将翻译指令输入大语言模型输出源语言句子的翻译结果，将源语言句子的翻译结果作为伪参考译文；步骤S10，将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法计算基于大语言模型提示的机器译文质量得分；将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法输出机器译文质量得分，选取其中最高的得分为基于大语言模型提示的机器译文质量得分；步骤S11，计算基于大语言模型的机器译文质量得分；线性加权步骤S8中预测的基于大语言模型深度表征的机器译文质量得分和步骤S10中基于大语言模型提示的机器译文质量得分，获取基于大语言模型的机器译文质量得分；步骤S1中训练集由多个不同样本组成，每个样本具体为：步骤S110，给定训练集中一个样本d={src,hypothesis,y}，其中d表示一个训练样本，src表示源语言句子，hypothesis表示机器译文，y表示机器译文的人类评价分值；将机器译文的人类评价分值使用最小-最大规范化方法缩放至[0,1]区间范围内，得到机器译文缩放后的人类评价分值，如公式（1）所示： 1；其中，yscaled表示机器译文缩放后的人类评价分值；ymax、ymin分别表示在训练集中机器译文的人类评价分值的最大值和在训练集中机器译文的人类评价分值的最小值；步骤S111，采用平均分类的方法设置机器译文的人类评价类别；将机器译文缩放后的人类评价分值按照所处的区间划分质量等级，质量等级是从0开始连续的10个自然数，如公式（2）所示： 2；其中，z表示机器译文的人类评价类别；步骤S2中提取源语言句子至机器译文的相似度特征向量，具体为：步骤S21，将规范化处理后的训练集内每个样本中的源语言句子和机器译文顺序相连，如公式（3）所示： 3；其中，s2h表示源语言句子至机器译文联合字符串，符号s、s表示字符串的起始符和字符串的终止符；步骤S22，将源语言句子至机器译文联合字符串输入到大语言模型Llama2，由大语言模型Llama2使用子词切分方法SentencePiece算法对源语言句子至机器译文联合字符串进行子词切分，得到包含m个子词的子词序列，如公式（4）所示： 4；其中，m表示源语言句子至机器译文联合字符串进行子词切分的子词个数；s1，s2，sm表示源语言句子至机器译文联合字符串进行子词切分后的第1个子词，第2个子词，第m个子词；步骤S23，大语言模型Llama2按照从左向右的顺序逐词生成源语言句子至机器译文的子词级别特征向量，如公式（5）所示： 5；其中，vs2h表示源语言句子至机器译文的子词级别特征向量，Llama2表示大语言模型Llama2输出函数，vs1，vs2，vsm分别表示源语言句子至机器译文的第1个子词的特征向量，第2个子词的特征向量，第m个子词的特征向量；步骤S24，大语言模型Llama2采用单向深度表示方法，提取源语言句子至机器译文的子词级别特征向量的最后一个子词的特征向量vsm作为源语言句子至机器译文的相似度特征向量；步骤S3中提取机器译文至源语言句子的相似度特征向量，具体为：步骤S31，将规范化处理后的训练集内每个样本中机器译文和源语言句子顺序相连，如公式（6）所示： 6；其中，h2s表示机器译文至源语言句子联合字符串；步骤S32，将机器译文至源语言句子联合字符串输入到大语言模型Llama2，由大语言模型Llama2使用子词切分方法SentencePiece算法对机器译文至源语言句子联合字符串进行子词切分，得到包含n个子词的子词序列，如公式（7）所示： 7；其中，n表示机器译文至源语言句子联合字符串进行子词切分的子词个数；h1，h2，hn表示机器译文至源语言句子联合字符串进行子词切分后的第1个子词，第2个子词，第n个子词；步骤S33，大语言模型Llama2按照从左向右的顺序逐词生成机器译文至源语言句子的子词级别特征向量，如公式（8）所示： 8；其中，vh2s表示机器译文至源语言句子的子词级别特征向量，vh1，vh2，vhn分别表示机器译文至源语言句子的子词级别特征向量的第1个子词的特征向量，第2个子词的特征向量，第n个子词的特征向量；步骤S34，取机器译文至源语言句子的子词级别特征向量的最后一个子词的特征向量vhn作为机器译文至源语言句子的相似度特征向量；步骤S4中提取机器译文质量估计特征向量，具体为：步骤S41，将步骤S2中源语言句子至机器译文的相似度特征向量和步骤S3中机器译文至源语言句子的相似度特征向量拼接，如公式（9）所示： 9；其中，x表示机器译文和源语言句子拼接特征向量，符号“⊕”表示向量拼接运算；步骤S42，将机器译文和源语言句子拼接特征向量输入到机器译文质量估计任务适配器层，输出机器译文质量估计特征向量，如公式（10）所示： 10；其中，QEFV表示机器译文质量估计特征向量，tanh表示神经网络的激活函数tanh，参数w1和b1为神经网络的可学习参数，T表示矩阵的转置操作；步骤S5中预测基于大语言模型深度表征的机器译文质量得分，具体为：将步骤S4中机器译文质量估计特征向量输入主回归网络层，预测基于大语言模型深度表征的机器译文质量得分，如公式（11）所示： 11；其中，Pvalues为预测的基于大语言模型深度表征的机器译文质量得分，参数w2和b2为神经网络的可学习参数；步骤S6中预测基于大语言模型深度表征的机器译文质量类别，具体为：将步骤S4中机器译文质量估计特征向量输入辅助分类网络层，预测基于大语言模型深度表征的机器译文质量类别，如公式（12）和公式（13）所示： 12； 13；其中，Probs为预测的基于大语言模型深度表征的机器译文质量类别概率，Pclass为预测的基于大语言模型深度表征的机器译文质量类别，argmax是返回向量最大值索引函数，softmax表示神经网络的激活函数softmax，参数w3和b3为神经网络的可学习参数。

全文数据：

权利要求：

百度查询：华东交通大学一种基于大语言模型的机器译文质量估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：马达

下一篇：光检测装置

相关技术

马达

光检测装置

电信网元实时处理方法、装置、设备、介质及程序产品

一种塑料导气管成型设备

一种炉头自动生产线及其工艺

印制电路板、器件焊接检测方法、装置及电子设备

为牵引电池充电的充电电路和方法、电动车辆

路径规划方法、系统、设备及计算机可读存储介质

多通阀、热管理系统和车辆

大语言模型生成SQL查询语句中的数据权限控制方法及设备

一种粗氨气净化及制取液氨的装置及方法

超临界CO₂腐蚀测试系统的样品加载装置

机器相关技术

机器人传动机构及机器人_深圳市优必选科技股份有限公司_202420530721.2

缝合机器人_江苏风和医疗器材股份有限公司_202310547460.5

清洁机器人_深圳银星智能集团股份有限公司_202010921653.9

机器人抄手_无锡雅佳智能节能科技有限公司_202420552030.2

作业机器人_中联重科股份有限公司_202410391533.0

巡检机器人_汪小鹏_202110467625.9

巡检机器人_深圳优艾智合机器人科技有限公司_202323512148.7

清洁机器人_元鼎智能创新(国际)有限公司_202420036959.X

球形机器人_重庆理工大学_202420707862.7

清洁机器人_深圳库犸科技有限公司_202420595293.1

译文相关技术

法语译文质量自动化评估方法、系统、设备及存储介质_浙江科技大学_202411207282.2

翻译文本修订方法、装置、计算机设备和存储介质_文思海辉智科科技有限公司_202010909502.1

一种基于深度交叉网络的机器译文自动评价方法_江西师范大学_202410872045.1

一种基于大语言模型的机器译文质量估计方法_华东交通大学_202410871902.6

一种翻译文本生成方法、装置、存储介质及电子设备_深圳市三六零智慧生活科技有限公司_202410611069.1

基于译文树结构解码路径动态选择的机器翻译方法_厦门大学_202111063749.7

一种基于大语言模型的机器译文质量估计方法_华东交通大学_202410871902.6

一种基于深度交叉网络的机器译文自动评价方法_江西师范大学_202410872045.1

翻译文件的生成方法、装置、电子设备、存储介质及产品_腾讯科技(深圳)有限公司_202310143807.X

用于翻译文档的方法及相关设备_北京字跳网络技术有限公司_202410520210.7

质量相关技术

压力管道质量检测装置_甘肃省特种设备检验检测研究院_202420351565.3

高质量耐磨板堆焊机_江苏鑫州耐磨科技有限公司_202420367308.9

语音质量评估方法和装置_中国电信股份有限公司_202010795964.5

一种水泥质量检测装置_南宁红狮水泥有限公司_202420383362.2

一种药品生产质量检测装置及方法_江苏御肽生物医药有限公司_202410730535.8

一种电压质量事件检测方法及系统_国网浙江省电力有限公司温州供电公司_202411045193.2

路面质量检测方法、装置及相关产品_寒武纪行歌(南京)科技有限公司_202210700323.6

一种沥青混凝土路面质量检测装置_山东林民公路材料有限公司_202411440446.6

端盖翻边机的工艺质量联控方法_广州纬华节能设备有限公司_202411394878.8

刹车件质量自动检测设备_江阴市丰华金属制品有限公司_202411041448.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大语言模型的机器译文质量估计方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务