买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种采用核化听觉模型的单通道声源分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形;其中,所述编码器和解码器均采用核化听觉模型;所述声源分离器采用基于一维时域卷积的源分离模型,所述编码器和解码器的训练过程和所述声源分离器的训练过程是独立的。本发明的方法在编码器和解码器中引入了模型偏置,有效减少了模型参数,极大降低了模型复杂度。
主权项:1.一种采用核化听觉模型的单通道声源分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形;其中,所述编码器和解码器均采用核化听觉模型;所述声源分离器采用基于一维时域卷积的源分离模型,所述编码器和解码器的训练过程和所述声源分离器的训练过程是独立的;所述编码器包括:模拟耳蜗被动机制的尾部滤波器和模拟耳蜗主动机制的顶部滤波器,且顶部滤波器被调整的耳蜗增益函数加权;则编码器的频率函数Wf的表达式为:Wf=Wtailf+wlin·Wtipf其中,Wtailf和Wtipf分别是尾部滤波器和顶部滤波器的频率函数,wlin是顶部滤波器相对于尾部滤波的增益;该增益和基底膜的IO增益函数相关;IO增益函数wdB可以表示为: A=-0.0894·Gmax+10.89B=1.1789·Gmax-11.789其中,C表示输入信号强度,Gmax是耳蜗放大器的最大增益,以dB为单位;顶部滤波器表示为频率f和三个参数{fc,pl,pu}的函数:Wtipf=Rxf;fc,pl,pu顶部滤波器的低频边和高频边的表达式为: 其中,fc为顶部滤波器中心频率,g=|f-fc|fc是一个标准化的频率变量,描述了中心频率fc到掩蔽噪声边相对中心频率的距离;dc=[ERBN1000][ERBNfc]·fc1000,将到中心频率fc的间隔表达为相对中心频率ERBN的值,dc被标准化为在fc=1000Hz时等于1;pl和pu决定了顶部滤波器低频边和高频边的尖锐程度;BRBNf是在频率f处的ERBN值;ERBN表示听觉滤波器的等价直角带宽,ERBNf=6.23·f2+93.39·f+28.52;尾部滤波器表示为频率f和三个参数{fcfrat,tl,tu}的函数:Wtailf=Rxf;fcfrat,tl,tu 其中,tl和tu决定了尾部滤波器低频边和高频边的尖锐度;顶部滤波器的中心频率可以根据信号的强度相对尾部滤波器的中心频率进行调整,frat表示这两个滤波器的中心频率之比;{frat,pl,pu,Gmax}是Prxp的线性函数,则它们可以表示为如下形式: 其中,Prxp表示探测音加掩蔽音在中心频率为探测频率处的尾部滤波器的输出级,以dB为单位;以上函数的截距和斜率分别为则编码器的滤波器Wf由参数θ唯一确定,其中所述解码器的滤波器的参数和编码器的滤波器的参数相同。
全文数据:
权利要求:
百度查询: 中国科学院声学研究所 一种采用核化听觉模型的单通道声源分离方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。