中电信人工智能科技(北京)有限公司周静获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信人工智能科技(北京)有限公司申请的专利基于指向性卷积波束形成的语音增强与分离方法、装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119943085B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411981375.0,技术领域涉及:G10L21/0272;该发明授权基于指向性卷积波束形成的语音增强与分离方法、装置是由周静;李杰;康健设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本基于指向性卷积波束形成的语音增强与分离方法、装置在说明书摘要公布了:本公开提供一种基于指向性卷积波束形成的语音增强与分离方法、装置,方法包括:先根据麦克风阵列,通过多通道观测信号构建历史观测信号矩阵,根据历史观测信号矩阵构建卡尔曼增益线性预测误差模型;再构建基于指向性波束形成器和最大零陷波束形成器的最小方差无失真响应波束形成模型,并估计语音加噪声协方差矩阵;利用基于分离的语音源估计的时变方差,联立卡尔曼增益线性预测误差模型、最小方差无失真响应波束形成模型,建立指向性卷积波束形成模型,通过交替迭代方式完成对语音信号进行增强与分离。本公开在含噪含混响环境下更好地抑制早期混响并降低晚期混响残留;通过构建指向性增益并实时估计噪声协方差矩阵,实现了更鲁棒的语音分离性能。
本发明授权基于指向性卷积波束形成的语音增强与分离方法、装置在权利要求书中公布了:1.一种基于指向性卷积波束形成的语音增强与分离方法,其特征在于,所述方法包括: 根据预设阵元数目的麦克风阵列,获取多通道观测信号,并构建适用于多通道线性预测去混响任务的历史观测信号矩阵; 根据所述历史观测信号矩阵,利用卡尔曼滤波和多通道线性预测,构建卡尔曼增益线性预测误差模型; 利用最大指向性波束形成器和最大零陷波束形成器,构建基于指向性增益的最小方差无失真响应波束形成模型; 基于指向性增益的最小方差无失真响应波束形成模型估计语音加噪声协方差矩阵,并基于分离的语音源估计时变方差; 利用所述时变方差,对所述卡尔曼增益线性预测误差模型、最小方差无失真响应波束形成模型进行联立,建立指向性卷积波束形成模型,并通过交替迭代方式完成对含噪含混响的多声源语音信号的增强与分离; 对所述卡尔曼增益线性预测误差模型、最小方差无失真响应波束形成模型进行联立,包括: 根据去混响信号,通过时变方差加权协方差矩阵对波束形成权重进行计算,建立波束形成模型; 基于拉格朗日乘子法,通过对所述波束形成模型求解,并对所述波束形成模型的解进行等价变换; 对进行等价变换的波束形成模型的解中的非目标信号协方差矩阵和目标信号协方差矩阵进行估计; 对进行等价变换的波束形成模型的解中的非目标信号协方差矩阵和目标信号协方差矩阵进行估计,包括: 根据基于静音段估计得到的噪声协方差矩阵,并基于导向矢量联合矩阵对信号成分间相关项进行消除,建立最大零陷滤波矩阵; 根据方向导向矢量,在方向空间内进行积分,并联合对角加载矩阵,建立最大指向性滤波矩阵; 基于所述最大指向性波束形成器和最大零陷波束形成器,通过指向性增益对掩蔽向量进行估计; 通过估计的所述掩蔽向量建立非目标信号的估计一般模型; 基于递归形式,通过所述估计一般模型完成对所述非目标信号协方差矩阵和目标信号协方差矩阵的估计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信人工智能科技(北京)有限公司,其通讯地址为:100034 北京市西城区西四北大街156、158、160号2幢1至2层2-6、2-9内01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励