Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东理工大学袁文浩获国家专利权

山东理工大学袁文浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东理工大学申请的专利一种可控的因果双路语音增强方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120510860B

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510999232.0,技术领域涉及:G10L21/0224;该发明授权一种可控的因果双路语音增强方法及系统是由袁文浩设计研发完成,并于2025-07-21向国家知识产权局提交的专利申请。

一种可控的因果双路语音增强方法及系统在说明书摘要公布了:本发明属于语音增强技术领域,具体涉及一种可控的因果双路语音增强方法及系统,方法包括:将实际场景中采集的含噪语音作为输入,进行短时傅里叶变换,得到包含幅度谱和相位谱的复数谱;构建流式编码器,将复数谱作为输入,提取含噪语音在时间维度和频率维度上的局部相关性;构建可控因果双路模块,在时间维度和频率维度上进行长期依赖关系建模,并通过控制参数对通道特征进行线性调制;构建流式幅度相位解码器,重构出增强语音的幅度谱和相位谱;结合重构后的幅度谱和相位谱,进行短时傅里叶逆变换,得到增强语音的波形。本发明实现了对语音增强网络输出特性的实时调节,在语音增强过程中可根据听者需求及时权衡噪声残留和语音失真水平。

本发明授权一种可控的因果双路语音增强方法及系统在权利要求书中公布了:1.一种可控的因果双路语音增强方法,其特征在于包括以下步骤: S1、将实际场景中采集的含噪语音作为输入,对含噪语音进行短时傅里叶变换,将时域信号转换为时频域信号,得到包含幅度谱和相位谱的复数谱; S2、构建基于空洞DenseNet和BatchNorm归一化的流式编码器,将复数谱作为输入,提取含噪语音在时间维度和频率维度上的局部相关性; S3、构建基于维度变换、时间维度建模、频率维度建模和通道特征线性调制的可控因果双路模块,将流式编码器的输出作为输入,在时间维度和频率维度上进行长期依赖关系建模,并通过控制参数对通道特征进行线性调制; 流式编码器输出的维度为B×C×T×F,其中B、C、T、F分别表示批量大小、通道数、时间维度、频率维度,输入至可控因果双路模块后,首先经过维度变换,将输入的维度转换为BF×T×C,然后基于通道特征的时间维度进行长时依赖关系建模,即时间维度建模,随后进行通道特征线性调制,再次经过维度变换,转为BT×F×C,随后进行基于通道特征的频率维度长时依赖关系建模,即频率维度建模,随后再次进行通道特征线性调制,并经过最后一次维度变换,转为B×C×T×F;将此时的输出结果作为可控因果双路模块输入,重复上述过程N次,最终得到可控因果双路模块的输出; S4、构建基于空洞DenseNet和BatchNorm归一化的流式幅度解码器和流式相位解码器,将可控因果双路模块的输出作为输入,对可控因果双路模块输出的特征进行解码,分别重构出增强语音的幅度谱和相位谱; S5、结合重构后的幅度谱和相位谱,进行短时傅里叶逆变换,得到增强语音的波形。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东理工大学,其通讯地址为:255000 山东省淄博市张店区新村西路266号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。