买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
摘要:本发明提供一种同声传译模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,方法包括:将源语言文字序列输入编码器,生成源语言文字序列的上下文表示;解码器结合历史生成的目标语言文字序列和源语言文字序列的上下文表示,通过掩码多头注意力机制进行推理,生成候选目标语言文字序列;基于翻译质量评估指标,将每个候选目标语言文字序列与源语言文字序列进行比较,确定每个候选目标语言文字序列的质量得分;将质量得分确定为目标函数的风险;采用梯度下降优化算法,最小化目标函数,根据目标函数通过反向传播算法对编码器和解码器进行迭代更新,生成同声传译模型。本发明可以训练出翻译的准确性和流畅性更高的同声传译模型。
主权项:1.一种同声传译模型训练方法,其特征在于,所述方法包括:对源语言文字序列和目标语言文字序列进行预处理;初始化编码器模型参数和解码器模型参数;将所述源语言文字序列输入编码器,通过编码器的多头注意力机制和前馈神经网络层,生成所述源语言文字序列的上下文表示;将所述源语言文字序列的上下文表示发送给解码器;解码器结合历史生成的目标语言文字序列和所述源语言文字序列的上下文表示,通过掩码多头注意力机制进行推理,生成候选目标语言文字序列;将所述源语言文字序列和所述候选目标语言文字序列输入到解码器;解码器确定每个候选目标语言文字序列在不同位置的注意力得分;对所述注意力得分进行归一化处理,确定每个候选目标语言文字序列的置信度;基于翻译质量评估指标,将每个候选目标语言文字序列与所述源语言文字序列进行比较,确定每个候选目标语言文字序列的质量得分;将所述质量得分确定为目标函数的风险;采用梯度下降优化算法,最小化目标函数,根据所述目标函数通过反向传播算法对编码器和解码器进行迭代更新,生成同声传译模型,其中,所述置信度作为迭代更新过程中的不确定性权重。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种同声传译模型训练方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。