达音网络科技(上海)有限公司赵晓涵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉达音网络科技(上海)有限公司申请的专利通过低延迟深度学习实现同时降噪和去混响获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114373473B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110290225.5,技术领域涉及:G10L21/0208;该发明授权通过低延迟深度学习实现同时降噪和去混响是由赵晓涵;陈若非;刘子赫;姚斯强设计研发完成,并于2021-03-18向国家知识产权局提交的专利申请。
本通过低延迟深度学习实现同时降噪和去混响在说明书摘要公布了:本发明提出了一种方法,包括从音频样本的帧中提取关于听觉系统的耳蜗冲激响应的频谱特征;从神经网络处获得该帧中语音信号的估值该神经网络在训练阶段接受过此类训练:即接受频谱特征作为输入并输出语音信号的估值其中语音信号的估值包括混响,但不包括该帧中存在的噪声;使用在训练阶段获得的映射参数将语音信号的估值映射到该帧的频域,从而获得该帧中混响语音频谱的估值;从时间分布式神经网络中获得该帧的去混响帧,其中该帧中的混响语音频谱的估值被用作该时间分布式神经网络的输入。
本发明授权通过低延迟深度学习实现同时降噪和去混响在权利要求书中公布了:1.一种用于对音频样本进行降噪和去混响的方法: 从音频样本的帧中提取关于听觉系统的耳蜗冲激响应的频谱特征; 从神经网络处获得该帧中语音信号的估值,该神经网络在训练阶段接受过此类训练:接受频谱特征作为输入并输出语音信号的估值,其中语音信号的估值包括混响,但不包括该帧中存在的噪声; 使用在训练阶段获得的映射参数,对从神经网络输出的语音信号的估值进行加权求和,其中所述语音信号的估值是对相敏掩模的估值,所述相敏掩模的估值包括预测的等效矩形带宽ERB子带增益,将ERB子带增益通过加权求和映射到对应频率仓,以计算该帧中各频率仓的增益,将所述频率仓的增益与该帧的混合语音频谱相乘,从而获得该帧中混响语音频谱的估值;以及 从时间分布式神经网络处获得该帧的去混响帧,其中该帧中的混响语音频谱的估值被用作该时间分布式神经网络的输入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人达音网络科技(上海)有限公司,其通讯地址为:200131 上海市浦东新区中国(上海)自由贸易试验区华申路180号1幢2层2009室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。