买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国兵器工业计算机应用技术研究所
摘要:本发明涉及一种基于二次谱减法的复杂噪声背景下的语音识别方法和系统,属于语音增强技术领域。该方法包括:选取复杂噪声背景下的含噪历史音频和纯净噪声音频,经过计算处理得到历史噪声估计;对复杂噪声背景下的待识别音频进行分帧处理,得到多帧音频;依次对每帧音频进行处理:基于历史噪声估计和当前帧音频的噪声估计,确定历史噪声移除因子和当前帧音频噪声移除因子,对当前帧音频进行二次谱减,得到当前帧音频降噪后的语音频谱。该方法解决了对于现实世界中的背景噪声复杂采用现有技术无法将残余噪声控制到较低水平的问题。
主权项:1.一种基于二次谱减法的复杂噪声背景下的语音识别方法,其特征在于,包括如下步骤:基于复杂噪声背景下的含噪历史音频和纯净噪声音频,得到所述复杂噪声背景的历史噪声估计,包括:分别对每条所述含噪历史音频分帧,处理后得到含噪历史音频每帧信号的功率谱;选取每条音频上功率谱最低的预设数量帧的音频作为纯噪声,估计得到每条含噪历史音频的噪声的每一帧平均功率谱Biω,其中,i=1,2,3,……,n,n表示含噪历史音频的条数;对每条所述纯净噪声音频分帧,处理后得到每条纯净噪声音频每帧的平均噪声功率谱Bjω,其中,j=1,2,3,……,k,k表示纯净噪声音频的条数;将Biω和Bjω取平均值得到所述历史噪声估计对复杂噪声背景下的待识别音频进行分帧处理,得到多帧音频;依次对每帧音频进行处理,得到降噪后的语音;其中,对当前帧音频处理,包括:基于所述历史噪声估计和当前帧音频的噪声估计,对所述当前帧音频进行二次谱减,得到所述当前帧音频降噪后的语音频谱;其中,所述当前帧音频的噪声估计包括选取所述待识别音频中功率谱最低的预设数量帧的音频作为纯噪声;基于所述纯噪声估计待识别音频的每一帧的噪声平均功率谱即当前帧音频的噪声估计;利用下述公式对所述当前帧音频进行二次谱减,得到当前帧音频的功率谱估计,即所述当前帧音频降噪后的语音频谱: 其中,表示当前帧音频的功率谱估计,m表示当前帧音频的序号,Yn+1ω,m表示当前帧音频的频谱,ψn+1ω,m表示当前帧音频的相位信息;αm、βm分别是历史噪声移除因子和当前帧音频噪声移除因子;bm是音频信号最低频谱因子;利用下述公式计算得到所述αm、βm和bm: 其中,c为常数,ξm为所述当前帧音频信号频域的后验信噪比;αmin、αmax分别表示αm的最小值和最大值;βmin、βmax分别表示βm的最小值和最大值;bmin、bmax分别表示bm的最大值和最小值。
全文数据:
权利要求:
百度查询: 中国兵器工业计算机应用技术研究所 基于二次谱减法的复杂噪声背景下的语音识别方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。