沈阳雅译网络技术有限公司徐萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉沈阳雅译网络技术有限公司申请的专利一种基于块的自注意力实时端到端语音翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114141231B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111359836.7,技术领域涉及:G10L15/02;该发明授权一种基于块的自注意力实时端到端语音翻译方法是由徐萍;宁义明设计研发完成,并于2021-11-17向国家知识产权局提交的专利申请。
本一种基于块的自注意力实时端到端语音翻译方法在说明书摘要公布了:本发明公开一种基于块的自注意力实时端到端语音翻译方法,步骤为:预处理录制好的音频文件训练数据,将每条语音的ID及其存储的路径和对应的目标语文本进行映射,构建两个映射文件;分别提取音频的梅尔滤波器组和梅尔频率倒谱系数两种声学特征;利用训练数据构建目标语词典,用于解码时生成目标语文本序列;对训练数据进行清洗,并转换为端到端语音翻译模型需要的格式文件;初始化端到端语音翻译模型,用特定格式的数据文件进行训练;在推断阶段,设置块的大小,使用训练完成的端到端语音翻译模型对源语音进行动态编码,实现实时生成目标语句子。本发明使模型具备实时进行语音翻译的能力,在模型性能没有下降的情况下,提高了模型的解码速度。
本发明授权一种基于块的自注意力实时端到端语音翻译方法在权利要求书中公布了:1.一种基于块的自注意力实时端到端语音翻译方法,其特征在于包括以下步骤: 1)预处理录制好的音频文件训练数据,将每条语音的ID及其存储的路径和对应的目标语文本进行映射,构建两个映射文件; 2)提取音频文件的声学特征,分别提取音频的梅尔滤波器组和梅尔频率倒谱系数两种声学特征; 3)利用训练数据构建目标语词典,用于解码时生成目标语文本序列; 4)对训练数据进行清洗,并转换为端到端语音翻译模型需要的格式文件; 5)初始化端到端语音翻译模型,用特定格式的数据文件进行训练; 6)进入推断阶段,设置块的大小,使用训练完成的端到端语音翻译模型对源语音进行动态编码,实现实时生成目标语句子; 步骤6)中进入推断阶段,设置块的大小,使用训练完成的端到端语音翻译模型对源语音进行动态编解码,实现实时生成目标语句子,具体为: 601)设置块的大小,在解码时,在每个固定大小的块内对记忆向量进行注意力权重的计算,再用加权求和的方式得到相应的上下文向量,块大小的设置不宜过小,从而可以获得更多的上下文信息; 602)在解码时,为了确定块的位置,需要计算上一个输出时所选择的块的最后一个记忆向量的选择概率,若概率大于等于0.5,则以该向量为块的最后一个单元,往前一个窗口大小的块内进行注意力计算,若概率小于0.5,则扫描下一个记忆向量递归计算选择概率,直到确定块的位置; 603)若直到最后一个记忆向量为止所有向量的选择概率都小于0.5,则将上下文向量置为零向量; 604)通过训练好的解码器,得到输出的目标语文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沈阳雅译网络技术有限公司,其通讯地址为:110004 辽宁省沈阳市和平区三好街78号东软电脑城C座11层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。