恭喜内蒙古工业大学苏依拉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜内蒙古工业大学申请的专利一种卷积增强的蒙汉神经机器翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115099245B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210542568.0,技术领域涉及:G06F40/58;该发明授权一种卷积增强的蒙汉神经机器翻译方法是由苏依拉;朱苏东;杨蕾;司赟;杨佩恒;邱占杰;仁庆道尔吉;吉亚图设计研发完成,并于2022-05-18向国家知识产权局提交的专利申请。
本一种卷积增强的蒙汉神经机器翻译方法在说明书摘要公布了:一种卷积增强的蒙汉神经机器翻译方法,分别对蒙古语数据与汉语数据进行预处理;基于Transformer网络构建翻译模型,所述翻译模型包括输入模块、Conformer模块、Decoder模块和输出模块;对翻译模型进行训练;使用BLUE值对翻译模型进行评价。本发明充分利用Transformer的结构优点,提高翻译模型局部信息的捕捉。本发明修改了Transformer编码器的结构,将卷积神经网络与Transformer相结合,对句子进行全局与局部的建模,将实现全局与局部的最佳,提高了翻译译文的BLUE值。
本发明授权一种卷积增强的蒙汉神经机器翻译方法在权利要求书中公布了:1.一种卷积增强的蒙汉神经机器翻译方法,其特征在于,包括: 步骤1,分别对蒙古语数据与汉语数据进行预处理; 步骤2,基于Transformer网络构建翻译模型,所述翻译模型包括输入模块、Conformer模块、Decoder模块和输出模块; 步骤3,对翻译模型进行训练; 步骤4,使用BLUE值对翻译模型进行评价; 所述输入模块,将经过步骤1进行分词处理的蒙古语句子序列中的单词依次经过词向量编码后添加位置编码,得到当前词的位置,计算公式如下: 位置编码为一个二维矩阵,行表示词语,列表示词向量;其中,pos表示单词在句子中的绝对位置,pos=0,1,2…,dmodel表示单词的词向量维度,i表示表示词向量的位置,PEpos,2i和PEpos,2i+1的含义是在每个词语的词向量的偶数位置添加sin变量,奇数位置添加cos变量,以此来填满整个位置编码矩阵; 所述Conformer模块由多个相同的Conformer子模块堆叠而成,每个Conformer子模块由第一FFN子层、第一多头自注意力子层、卷积层和第二FFN子层组成; 第一FFN子层进行的计算如下: FFNx=max0,xW1+b1W2+b2 其中,W1、W2为维度相反的两个权值矩阵,b1、b2为超参数;FFNx通过与三个权值矩阵WQ、WK和WV分别相乘,得到第一多头自注意力子层计算所需的Query向量Q1、Keys向量K1和Values向量V1; 在第一多头自注意力子层进行的计算如下: 第一步,计算蒙古语句子中单词之间的相关性得分向量score1: 第二步,对相关性得分向量进行归一化,表示为score′1,计算如下: 其中,是K1的维度; 第三步,通过softmax函数,将归一化的相关性得分向量score′1转换成[0,1]之间的概率分布,即softmaxscore′1; 第四步,将所述概率分布与对应的Values向量V1相乘,计算如下: Z1=softmaxscore′1V1 所述卷积层以Z1为输入,经过卷积计算得到Z′1; 所述第二FFN子层以Z′1为输入,计算FFNZ′1; 各个Conformer子模块循环计算,其中第一个Conformer子模块的第一FFN子层中,x取所述输入模块的输出,其余Conformer子模块的第一FFN子层中,x取上一Conformer子模块的FFNZ′1,最后一个Conformer子模块的第二FFN子层中,FFNZ′1进一步计算得到Decoder模块计算所需Keys向量K3和Values向量V3; 所述第一FFN子层和第二FFN子层均具有半步剩余连接。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人内蒙古工业大学,其通讯地址为:010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。