买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:阿里巴巴集团控股有限公司
摘要:本申请公开了一种语音识别方法及装置和智能音箱,本申请使用根据近场语音和远场语音训练好的降噪自动编码器,将需要识别的语音信息的声纹特征向量,特别是远场的声纹特征向量,投影到了与近场声纹特征尽可能相似的空间,再利用降噪自动编码器输出的声纹特征向量实现后续对语音用户身份的识别,降低了由于说话人与设备之间的距离而带来的不能准确识别出远离设备的说话人身份的问题,提升了远场声纹识别的鲁棒性。
主权项:1.一种语音识别方法,包括:利用降噪自动编码器提取需要识别的语音信息的声纹特征向量;其中,降噪自动编码器是根据近场语音和远场语音训练得到的,所述声纹特征向量是通过说话人识别神经网络获取得到的,所述说话人识别神经网络是通过所述近场语音、所述远场语音以及说话人身份标识训练得到的,所述降噪自动编码器用于将远场声纹特征向量投影为近场声纹特征向量,所述降噪自动编码器是利用多组不同用户的近场声纹特征向量和远场声纹特征向量对,对神经网络模型进行训练得到的;根据提取的声纹特征向量确定需要识别的语音信息的用户身份。
全文数据:
权利要求:
百度查询: 阿里巴巴集团控股有限公司 一种语音识别方法及装置和智能音箱
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。