买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国电信股份有限公司
摘要:本公开提供了一种语音唤醒方法、装置、电子设备和计算机可读存储介质,涉及语音处理技术领域。所述方法包括:根据预先训练的神经网络模型对待识别语音的语谱图进行处理,得到待识别语音的声纹特征向量和唤醒词;根据预设的对应关系表,查询与唤醒词对应的注册唤醒词标签,并根据注册唤醒词标签,得到注册特征向量;根据声纹特征向量和注册特征向量,计算向量相似度;在向量相似度大于预设的阈值的情况下,进行语音唤醒。利用一个神经网络模型同时实现声纹识别和语音唤醒词匹配这两个任务,解决了两个任务分别构建模型导致的参数冗余、占用内存过大的问题,本公开流程更加简洁,唤醒速度更快。
主权项:1.一种语音唤醒方法,其特征在于,包括:根据预先训练的神经网络模型对待识别语音的语谱图进行处理,得到所述待识别语音的声纹特征向量和唤醒词,所述神经网络模型包括第一目标网络结构和第二目标网络结构;根据预设的对应关系表,查询与所述唤醒词对应的注册唤醒词标签,并根据所述注册唤醒词标签,得到注册特征向量;根据所述声纹特征向量和所述注册特征向量,计算向量相似度;在所述向量相似度大于预设的阈值的情况下,进行语音唤醒;其中,所述第一目标网络结构和第二目标网络结构通过以下方式得到:基于多梯度下降算法MGDA算法构建训练损失函数;根据训练数据集、带有网络结构参数的初始网络结构和所述训练损失函数,固定所述网络结构的网络结构参数,通过训练获得网络操作权重;基于MGDA算法构建验证损失函数;固定所述网络操作权重,根据验证数据集和所述验证损失函数,通过训练获得新的网络结构参数,以得到过程网络结构;计算语音唤醒词识别和声纹识别梯度,得到公共梯度下降方向的更新共享参数,重新进行训练,直至满足预设的第二训练停止条件,得到目标网络结构,所述目标网络结构包括所述第一目标网络结构和第二目标网络结构中的一种。
全文数据:
权利要求:
百度查询: 中国电信股份有限公司 语音唤醒方法、装置、电子设备和计算机可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。