恭喜南京大学雷桐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京大学申请的专利基于PESQ驱动的强化学习估计先验信噪比的语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114141266B 。
龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111516319.6,技术领域涉及:G10L21/0216;该发明授权基于PESQ驱动的强化学习估计先验信噪比的语音增强方法是由雷桐;卢晶设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。
本基于PESQ驱动的强化学习估计先验信噪比的语音增强方法在说明书摘要公布了:本发明公开了一种基于PESQ驱动的强化学习估计先验信噪比的语音增强方法,具体步骤如下:1使用清晰语音和噪声数据集生成模拟含噪语音,并做短时傅里叶变换得到短时傅里叶谱;2用清晰语音和含噪语音的短时傅里叶谱训练DeepXi‑TCN网络;3用理想的映射信噪比通过K‑means聚类生成有限个聚类中心,作为先验信噪比模板;4正式训练阶段,通过DQN网络在帧层面挑选DeepXi‑TCN推断的信噪比或者先验信噪比模板,计算出与PESQ值相关的奖励,进行强化学习迭代,更新网络参数;5将含噪语音短时傅里叶谱输入完成训练的模型,得到的增强语音的短时傅里叶谱,再进行逆短时傅里叶变换。本发明能进一步优化DeepXi‑TCN推断的先验信噪比,从而提高与听感相关的语音质量。
本发明授权基于PESQ驱动的强化学习估计先验信噪比的语音增强方法在权利要求书中公布了:1.基于PESQ驱动的强化学习估计先验信噪比的语音增强方法,其特征在于,该方法包括以下步骤:步骤1,使用训练集中的清晰语音和噪声以随机信噪比合成模拟含噪语音,并对三者做短时傅里叶变换分别得到清晰语音短时傅里叶谱、噪声短时傅里叶谱和模拟含噪语音短时傅里叶谱;步骤2,使用所述清晰语音短时傅里叶谱和模拟含噪语音短时傅里叶谱训练DeepXi-TCN网络;步骤3,利用所述清晰语音短时傅里叶谱幅度和噪声短时傅里叶谱幅度相除,并将其范围映射到[0,1],生成训练集的映射信噪比,然后通过K-means聚类生成有限个聚类中心,作为先验信噪比模板;步骤4,利用所述先验信噪比模板给所述模拟含噪语音的每帧打标签,用以训练DQN网络初始化参数;步骤5,正式训练阶段,通过所述DQN网络在帧层面挑选信噪比模板,信噪比模板为步骤2完成训练的DeepXi-TCN网络推断的信噪比或者步骤3生成的先验信噪比模板;然后计算出与PESQ值相关的奖励,进行强化学习迭代,更新所述DQN网络参数;步骤6,将测试集清晰语音和噪声合成的含噪语音短时傅里叶谱输入步骤5完成训练的DQN网络,并将得到的增强语音的短时傅里叶谱进行逆短时傅里叶变换,得到增强语音的时域信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210046 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。