南京邮电大学;南京龙垣信息科技有限公司邵曦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学;南京龙垣信息科技有限公司申请的专利基于改进卷积循环网络的轻量化单通道语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119993175B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510157170.9,技术领域涉及:G10L21/02;该发明授权基于改进卷积循环网络的轻量化单通道语音增强方法是由邵曦;周赵卿;孙林慧;沈星翰;丁卓设计研发完成,并于2025-02-13向国家知识产权局提交的专利申请。
本基于改进卷积循环网络的轻量化单通道语音增强方法在说明书摘要公布了:本发明涉及语音增强技术领域,具体涉及一种基于改进卷积循环网络的轻量化单通道语音增强方法:充分利用改进卷积循环网络在提取特征时的出色能力,使用聚合分组双路径循环网络和卷积混合分组双路径循环网络来提升多通道的深度时频特征以及对各通道之间的特征进行融合,使得深度特征所包含的语音信息更加的丰富,再利用深度特征来训练分离模型,进一步增强语音的性能,并且提出了聚合分组双路径循环网络和卷积混合分组双路径循环网络,改进了分组双路径循环网络架构,不仅使得卷积循环网络的语音增强性能得到了提升,而且保持了模型的轻量化,从而提高了增强模型的有效性,使得增强语音的清晰度和可懂度提高。
本发明授权基于改进卷积循环网络的轻量化单通道语音增强方法在权利要求书中公布了:1.一种基于改进卷积循环网络的轻量化单通道语音增强方法,其特征在于, 包括如下步骤: 步骤1、对输入的单通道语音信号进行预处理,分别提取语音信号的实数谱、虚数谱和幅度谱特征,形成三通道的实值张量输入,同时使用等效矩形带宽频带处理模块对高频段进行压缩; 步骤2、将压缩后的频带特征使用频谱特征增强模块进行展开与重组; 步骤3、将展开与重组后的频带特征输入改进后的卷积循环网络,提取语音的深度特征,增强信号的复数比掩模作为输出,通过训练网络权重和偏置,得到训练完成的用于增强语音信号的卷积循环网络; 步骤4、将用于测试的含噪语音信号的音频特征输入训练完成的用于增强语音信号的卷积循环网络,以实现对含噪语音信号进行增强; 步骤3中改进后的卷积循环网络由编码器、解码器、聚合分组双路径循环网络和卷积混合分组双路径循环神经网络四部分组成; 其中,所述编码器用于生成高维嵌入表示,所述解码器用于逐步恢复特征的原始维度,所述聚合分组双路径循环网络将高维的时频特征输入进一步进行增强,所述卷积混合分组双路径循环神经网络用于局部特征提取和通道之间的特征融合,同时解码器反卷积块的输出为增强信号的复数比掩模,将掩模与输入复数谱矩阵相乘后通过逆短时傅里叶变换重建增强语音信号,并通过约束损失函数进行参数寻优以训练所述卷积循环网络; 步骤3中的卷积混合分组双路径循环神经网络用于将一种改进的深度可分离卷积模块与分组双路径循环网络相结合,所述改进的深度可分离卷积模块包含深度卷积、逐点卷积和残差连接,所述深度卷积使用大卷积内核提取每个通道的全局信息,所述逐点卷积采用了倒置瓶颈设计,两个逐点卷积层之间的隐藏维度设置为输入维度的四倍宽,用于充分的融合各通道之间的全局信息,最后在每个卷积层之后使用GELU激活函数和BatchNorm正则化; 改进的深度可分离卷积模块的表达式为: ; ; ; 其中,表示分组双路径循环网络的输出作为深度可分离卷积模块的输入,表示GELU激活函数,表示BatchNorm正则化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学;南京龙垣信息科技有限公司,其通讯地址为:210000 江苏省南京市文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励