首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

语音端点检测方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京捷通华声科技股份有限公司

摘要:本申请实施例涉及一种语音端点检测方法和装置,所述方法包括:对待检测语音进行语音特征提取,得到多个特征帧,分别计算预先训练的语音模型和预先训练的非语音模型与每一个所述特征帧的语音似然值和非语音似然值来判断每一个所述特征帧为语音帧或非语音帧,基于所述语音帧和所述非语音帧分别对所述语音模型和所述非语音模型进行自适应更新,使用更新后的模型判断待检测语音的端点。本申请的语音端点检测方法使用较少的具体的场景下的数据量调整后,就能够精准检测具体场景下得语音和非语音。

主权项:1.一种语音端点检测方法,其特征在于,所述方法包括:对待检测语音进行语音特征提取,得到多个特征帧;计算预先训练的语音模型与每一个所述特征帧的语音似然值以及计算预先训练的非语音模型与每一个所述特征帧的非语音似然值;基于所述语音似然值和所述非语音似然值计算得到每一个所述特征帧的信噪似然比;基于所述信噪似然比判断每一个所述特征帧对应在所述待检测语音中的帧为语音帧或非语音帧;基于所有所述语音帧对所述语音模型进行自适应更新,以及基于所有所述非语音帧对所述非语音模型进行自适应更新;使用更新后语音模型和更新后非语音模型分别计算每一个所述特征帧的最终语音似然值和最终非语音似然值;基于所述最终语音似然值和所述最终非语音似然值计算得到每一个所述特征帧的最终信噪似然比,基于所述最终信噪似然比检测所述待检测语音的端点;所述对待检测语音进行语音特征提取,包括:对所述待检测语音进行预加重,提升所述待检测语音的高频部分,得到预加重后待检测语音;将所述预加重后待检测语音划分为多个初始语音帧;将每一个所述初始语音帧乘以汉明窗,得到中间处理后信号;对所述中间处理后信号进行快速傅里叶变换,得到所述语音帧的频谱以及能量分布;通过一组梅尔Mel尺度的三角形滤波器组对能量谱进行滤波,以对所述语音帧的频谱进行平滑化;计算每个三角形滤波器组输出的对数能量,所述对数能量经离散余弦变换DCT得到梅尔倒谱MFCC系数,将所述梅尔倒谱MFCC系数作为所述语音特征;所述基于所有所述语音帧对所述语音模型进行自适应更新,以及基于所有所述非语音帧对所述非语音模型进行自适应更新,包括:满足条件时,停止对所述语音模型和非语音模型的自适应更新;所述条件包括以下至少一者:直到所述特征帧的信噪似然比的结果稳定;直到所述语音模型或所述非语音模型的更新误差小于预设阈值;所述方法还包括:在进行端点检测前,使用语音数据训练语音模型,使用背景数据训练非语音模型;所述语音数据为待检测的目标人的语音数据,所述背景数据为待检测目标人的语音以外的语音数据;所述背景数据包含目标人以外的其他人的语音。

全文数据:

权利要求:

百度查询: 北京捷通华声科技股份有限公司 语音端点检测方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术