买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种适用于车内语音识别系统的语音端点检测方法及模块,所述模块包括语音帧判断单元和语音帧标记单元,所述语音帧判断单元用于检测出实时音频数据中的含语音帧,所述语音帧标记单元用于根据所述语音帧判断单元的检测结果对所述实时音频数据中的含语音帧进行标记。本发明提供的适用于车内语音识别系统的语音端点检测方法及模块结合实际场景的行车工况特征,建立多特征融合的端点检测模型,采用具有维度差异的模型框架,并结合语音的语谱图像特点设计卷积核,提升了语音识别准确率。
主权项:1.一种适用于车内语音识别系统的语音端点检测方法,其特征在于,包括以下步骤:S1、对采集的语音音频数据、行车过程中的噪声音频数据以及与所述噪声音频数据相对应的行车工况数据进行预处理,以得到多组待训练的样本数据;S2、利用PRNet网络模型分别对若干组所述样本数据进行特征提取和分类任务,并通过全连接操作分别输出预测结果;S3、将所述预测结果与对应的样本数据中的标签结果分别进行损失函数计算,根据计算结果不断调整所述PRNet网络模型的参数权重;S4、多次循环执行S2-S3,进行训练,当所述PRNet网络模型训练的循环次数等于提前设置的次数,或者所述计算结果达到预设的精度范围,则停止训练,以得到最优的PRNet网络模型;S5、将实际行车过程中预处理后的实时音频数据和相应行车工况数据输入至所述最优的PRNet网络模型,所述最优的PRNet网络模型输出检测结果;S6、根据所述检测结果,对所述实时音频数据中的含语音帧进行标记;S7、将带标记的实时音频数据输出至下游的语音识别系统。
全文数据:
权利要求:
百度查询: 清华大学苏州汽车研究院(相城) 华研慧声(苏州)电子科技有限公司 一种适用于车内语音识别系统的语音端点检测方法及模块
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。