齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)李晔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)申请的专利基于熵编码残差量化与频谱修复的语音重建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121096348B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511631176.1,技术领域涉及:G10L19/00;该发明授权基于熵编码残差量化与频谱修复的语音重建方法及系统是由李晔;王靖祥;张鹏;蔡田雨;任淑贤设计研发完成,并于2025-11-10向国家知识产权局提交的专利申请。
本基于熵编码残差量化与频谱修复的语音重建方法及系统在说明书摘要公布了:本公开提供了基于熵编码残差量化与频谱修复的语音重建方法及系统,涉及人工智能语音信号处理技术领域,包括:获取原始语音波形,将语音波形输入至神经语音编解码模型中,首先进入编码器将输入语音波形映射为声学潜在表征,声学潜在表征再通过残差向量量化模块逐层执行残差量化,引入基于门控的动态层数选择机制与熵正则约束,使比特在不同语音片段间自适应分配,重建潜在表征的重构声学特征,将重构声学特征输入至解码器还原为时域波形,再通过频谱修复模块映射到对数幅度谱域,在对数幅度谱域预测残差并进行置信度门控融合,得到复谱,再经过时域合成后输出得到重建语音。本公开能够在极低码率下兼顾语音的高保真度、可懂度与传输的可靠性。
本发明授权基于熵编码残差量化与频谱修复的语音重建方法及系统在权利要求书中公布了:1.基于熵编码残差量化与频谱修复的语音重建方法,其特征在于,包括: 获取原始语音波形,并进行预处理; 将预处理后的语音波形输入至神经语音编解码模型中,输出得到重建语音; 其中,所述预处理后的语音波形在神经语音编解码模型中的处理过程包括: 输入的语音波形首先进入编码器,编码器采用多层卷积残差结构与分级下采样,将输入语音波形映射为声学潜在表征,将声学潜在表征输入至残差向量量化模块,对声学潜在表征逐层执行残差量化,引入基于门控的动态层数选择机制与熵正则约束,使比特在不同语音片段间自适应分配,得到量化特征,对量化特征进行重建得到潜在表征的重构声学特征,将重构声学特征输入至解码器,经分级上采样与残差块还原为时域波形,将时域波形通过频谱修复模块映射到对数幅度谱域,在对数幅度谱域预测残差并进行置信度门控融合,得到复谱,再经过时域合成后输出得到重建语音; 所述将声学潜在表征输入至残差向量量化模块,对声学潜在表征逐层执行残差量化,引入基于门控的动态层数选择机制与熵正则约束,使比特在不同语音片段间自适应分配,包括: 对声学潜在表征逐层执行残差量化,每层以设定码本近邻量化当前残差得到索引以及重构向量,并更新残差; 为在既定码率下自适应选择层数,引入基于门控的动态层数选择机制,用一个轻量打分网络对每层生成重要性得分,经动态门控归一化得到门控概率,将时间维度做平均池化得到片段级得分,并与目标码率之间的映射关系计算可用层深n,按片段级得分从高到低选取前n层作为激活层集; 为均衡码字使用率,在每个码本上对经验分布加入归一化熵正则,并配以小权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心),其通讯地址为:250000 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励