大连海事大学张维维获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连海事大学申请的专利一种低信噪比音频信号的语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120164480B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510284302.4,技术领域涉及:G10L21/0224;该发明授权一种低信噪比音频信号的语音增强方法是由张维维;高金艺;刘珊珊设计研发完成,并于2025-03-11向国家知识产权局提交的专利申请。
本一种低信噪比音频信号的语音增强方法在说明书摘要公布了:本发明提供了一种低信噪比音频信号的语音增强方法,包括如下步骤:第一阶段训练:S1、将音频信号的频谱输入编解码器网络,得到第一阶段增强语音;S4、计算声学参数损失;S5、计算细粒度频谱特征损失;S6、将两种损失和频域损失组合构建第一阶段损失进行训练,得到的第一阶段增强器;第二阶段训练:S7、将S1输出、纯净语音和残留噪声通过编码器获取特征并计算对比学习损失;S9、基于第一阶段损失和对比学习损失构建第二阶段损数,进行第二阶段训练,得到第二阶段增强器;推理阶段:S10、将含噪音频输入依次连接的两阶段增强器,得到目标语音。本发明考虑了声学参数特征和细粒度频谱特征对增强后语音信号的影响。
本发明授权一种低信噪比音频信号的语音增强方法在权利要求书中公布了:1.一种低信噪比音频信号的语音增强方法,其特征在于,包括如下步骤: 第一阶段训练: S1、将音频信号的短时傅里叶变换谱输入到复数编码器网络,提取实虚部特征,得到编码器网络的输出即中间特征; S2、将中间特征输入至Conformer模块,Conformer模块利用注意力网络建模时序信息,得到Conformer模块的输出; S3、将中间特征和Conformer模块的输出进行拼接后输入至复数解码器网络中得到频域输出,并将频域输出进行逆傅里叶变换,得到第一阶段时域增强语音; S4、将音频信号中的纯净语音和第一阶段时域增强语音输入至声学参数提取器分别获得纯净语音和第一阶段时域增强语音的嵌入,计算纯净语音和第一阶段时域增强语音的嵌入的均方根误差,计算声学参数损失函数; S5、将音频信号中的纯净语音和第一阶段时域增强语音输入至细粒度频谱特征提取器中,提取细粒度频谱特征提取器网络的倒数第二层输出作为细粒度频谱特征,使用均方根误差损失对齐细粒度频谱特征,计算细粒度特征损失函数; S6、基于声学参数损失函数,细粒度特征损失函数和频谱损失构建第一阶段的损失函数,使用第一阶段的损失函数进行第一阶段训练,输出训练后的第一阶段增强器; 训练过程如下:计算第一阶段损失函数对网络参数的梯度,使网络参数减去梯度与学习率的乘积,重复更新网络参数减小损失,直到更新后的网络参数在验证集上连续20个迭代没有提升,则终止训练; 第二阶段训练: S7、将第一阶段时域增强语音、纯净语音和残留噪声分别通过编码器获取特征; S8、基于S7获取的特征构造三元组,将三元组输入至对比学习方法中,得到对比学习损失函数; S9、基于声学参数损失函数、细粒度特征损失函数、对比学习损失函数和Llog-PCM构建第二阶段的损失函数,使用第二阶段的损失函数进行第二阶段训练,输出训练后的第二阶段增强器; 语音增强: S10、将待增强音频输入至训练后的第一阶段增强器中,输出第一阶段增强后的音频,将第一阶段增强后的音频输入至训练后的第二阶段增强器中,输出增强后的目标音频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市甘井子区凌水街道凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励