恭喜思必驰科技股份有限公司张强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜思必驰科技股份有限公司申请的专利语音交互方法、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114120984B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111517080.4,技术领域涉及:G10L15/08;该发明授权语音交互方法、电子设备和存储介质是由张强设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。
本语音交互方法、电子设备和存储介质在说明书摘要公布了:本发明公开一种语音交互方法、电子设备和存储介质。在该方法中,基于具有多麦克风通道的麦克风模块,采集环境音频文件;每一所述麦克风通道分别配置有相应的麦克风方位;从所述环境音频文件中提取说话人音频;针对所述环境音频文件,确定所述说话人音频在的各个麦克风通道的语音分量能量,并将对应具有最大语音分量能量的麦克风通道的麦克风方位确定为说话人方位;基于所述说话人方位,进行语音交互操作。由此,无需知道信号源位置等先验知识,利用对不同通道的语音帧能量分析来定位说话人方位,能有效规避环境噪声的干扰且能在更广泛的场景下适配。
本发明授权语音交互方法、电子设备和存储介质在权利要求书中公布了:1.一种语音交互方法,包括:基于具有多麦克风通道的麦克风模块,采集环境音频文件;每一所述麦克风通道分别配置有相应的麦克风方位;基于预设的盲源分离算法,从所述环境音频文件中提取说话人音频;检测所述说话人音频是否符合预设的语音唤醒条件;当所述说话人音频符合所述语音唤醒条件时,回滚盲源分离之前的语音帧,计算所述说话人音频在各个麦克风通道的语音分量能量,并将对应具有最大语音分量能量的麦克风通道的麦克风方位确定为说话人方位;基于所述说话人方位,进行语音交互操作;其中,基于所述说话人方位,进行语音交互操作,包括:基于摄像头采集对应所述说话人方位的环境图像;识别所述环境图像中是否存在目标对象信息;当在所述环境图像中识别到目标对象信息时,触发进行语音交互操作;当在所述环境图像中未识别到目标对象信息时,基于各个麦克风通道的麦克风方位,对所述说话人方位进行校准,包括:将对应具有语音分量能量排序第二的麦克风通道的麦克风方位确定为说话人方位,并调整所述摄像头以重新进行目标识别,以定位说话人位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人思必驰科技股份有限公司,其通讯地址为:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。