买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:宁波蛙声科技有限公司
摘要:本发明涉及一种实时语音去混响的混合方法,包括获取多麦克风通道的语音原始信号,对其进行预处理,获得多麦克风通道的频域语音信号;针对多麦克风通道的频域语音信号在多个波束方向进行固定波束形成,得到多个波束输出频域信号;对输出频域信号进行信噪比加权,获得第一级去混响后的单通道频域语音信号,基于其计算当前帧和先前一段时间内若干帧信号的归一化频域相干系数;基于频域相干系数估计当前帧的中晚期混响功率谱成分,结合混响功率谱成分,对中晚期混响成分进行抑制,获得混响抑制后的语音频谱,获得去混响后的时域语音信号。本发明达到了兼顾计算复杂度和去混响效果以及降低了对硬件资源的苛刻要求。
主权项:1.一种实时语音去混响的混合方法,其特征在于,包括以下步骤:S1:获取实时会议场景中的多个麦克风通道的语音原始信号,对所述语音原始信号进行加窗分帧和快速傅里叶变换预处理,获得多个麦克风通道的频域语音信号;S2:针对多个麦克风通道的频域语音信号在多个波束方向进行固定波束形成,得到多个波束输出频域信号;S3:对多个波束输出频域信号进行基于信噪比加权的波束融合处理,获得第一级去混响后的单通道频域语音信号,基于第一级去混响后的单通道频域语音信号计算当前帧和先前一段时间内若干帧信号的归一化频域相干系数;S4:基于所述归一化频域相干系数估计当前帧的中晚期混响功率谱成分,结合当前帧的中晚期混响功率谱成分,对中晚期混响成分进行抑制,获得混响抑制后的语音频谱,对混响抑制后的语音频谱进行快速傅里叶逆变换,获得去混响后的时域语音信号;其中,在S2中,针对多个麦克风通道的频域语音信号在多个波束方向进行固定波束形成,包括:根据波束方向以及波束形成权重对多个麦克风通道的频域信号进行求和,得到多个波束输出频域信号,其中,表示每个麦克风的复数频谱,表示波束形成复权重,表示波束形成的输出频域信号;在S3中,基于第一级去混响后的单通道频域语音信号计算当前帧和先前一段时间内若干帧信号的归一化频域相干系数,包括:所述归一化频域相干系数的计算公式如下: , , ,其中,和分别为第帧的频谱和自功率谱,,为对第帧和第P帧之间的互功率谱,为第帧和第P帧之间的归一化谱相干系数;在S4中,估计当前帧的中晚期混响功率谱成分,包括:所述当前帧的中晚期混响功率谱成分的计算公式为,其中,,其对应用于估计中晚期混响成分的历史帧,为第帧和第P帧之间的归一化谱相干系数。
全文数据:
权利要求:
百度查询: 宁波蛙声科技有限公司 实时语音去混响的混合方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。