买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本申请提供一种模型训练方法、方言识别方法、装置、服务器及存储介质,该方法包括:获取样本数据,该样本数据包括目标文本和目标文本对应的方言语音序列和普通话语音序列,基于第一编码器、第二编码器、第一注意力模块、第二注意力模块、连接时序分类器和解码器,并根据该方言语音序列和普通话语音序列,得到第一文本、第二文本和第三文本,之后根据目标文本、第一文本、第二文本和第三文本,确定方言识别模型的目标损失值,并根据该目标损失值确定方言识别模型是否收敛,当确定方言识别模型未收敛,则更新方言识别模型的模型参数,并继续对更新后的方言识别模型进行训练,直至方言识别模型收敛,本方案使方言识别模型的训练更加简便和准确。
主权项:1.一种模型训练方法,其特征在于,所述模型训练方法用于训练方言识别模型,所述方法应用于服务器,所述方言识别模型包括第一编码器、第二编码器、第一注意力模块、第二注意力模块、连接时序分类器和解码器,所述方法包括:获取样本数据,其中,所述样本数据包括目标文本和所述目标文本对应于的方言语音序列和普通话语音序列;将所述方言语音序列输入至所述第一编码器,得到第一特征向量,并将所述普通话语音序列输入至所述第二编码器,得到第二特征向量;将所述第一特征向量和第二特征向量输入至所述连接时序分类器,得到第一文本;将所述第一特征向量输入至所述第一注意力模块,得到第一上下文关联向量,并将所述第二特征向量输入至所述第二注意力模块,得到第二上下文关联向量;将所述第一上下文关联向量和第二上下文关联向量输入至所述解码器,得到第二文本和第三文本;根据所述目标文本、第一文本、第二文本和第三文本,确定所述方言识别模型的目标损失值,目标损失函数是通过所述第一注意力模块或第二注意力模块的第一损失函数、所述连接时序分类器的第二损失函数和所述编码器的第三损失函数确定的;根据所述目标损失值,确定所述方言识别模型是否收敛;若所述方言识别模型未收敛,则更新所述方言识别模型的模型参数,并继续对更新后的所述方言识别模型进行训练,直至所述方言识别模型收敛;其中,所述根据所述目标文本、第一文本、第二文本和第三文本,确定所述方言识别模型的目标损失值,包括:基于所述第一损失函数,根据所述目标文本和所述第二文本,确定第一损失值;基于所述第二损失函数,根据所述目标文本和所述第一文本,确定第二损失值;基于所述第三损失函数,根据所述第二文本和所述第三文本,确定第三损失值;根据所述第一损失值、第二损失值和第三损失值,确定所述方言识别模型的目标损失值。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 模型训练方法、方言识别方法、装置、服务器及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。