首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于UNET架构的语音带宽扩展方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南工商大学

摘要:本发明公开了一种基于UNET架构的语音带宽扩展方法。包括以下步骤:1建立语音带宽扩展模型,包括下采样模块、上采样模块、跨通道特征增强模块;2采用所述语音带宽扩展模型对待扩展窄带语音进行处理,基于已有低频语音重建语音的高频部分。本发明通过改进UNET框架中的上采样模块和下采样模块处理过程降低模型参数,通过在瓶颈层中引入通道注意力模型增强语音特征,减少模型参数量的同时又能确保高频重建音质。

主权项:1.一种基于UNET架构的语音带宽扩展方法,其特征在于,该方法包括以下步骤:1建立语音带宽扩展模型,包括下采样模块、上采样模块、跨通道特征增强模块,其中,下采样模块包括浅层特征提取模块、浅层特征增强模块、特征自生成扩展模块,浅层特征提取模块将原始数据进行升维提取出原始数据的浅层特征,浅层特征增强模块将浅层特征进行增强,特征自生成扩展模块将增强后的特征维度通过线性计算扩展至两倍,跨通道特征增强模块补充特征通道间的关系;上采样模块包括特征自生成信号恢复模块,神经网络训练模型的主要参数计算集中在此模块中,将特征信息进行恢复,通过特征自生成信号恢复模块对输入的特征通道数压缩降维,再通过线性计算生成增强特征,降维特征与增强特征堆叠来达到信息恢复;2采用所述语音带宽扩展模型对待扩展窄带语音进行处理,基于已有低频语音重建语音的高频部分;其中,步骤2具体为:s1下采样模块中的浅层特征提取模块将预处理后的一维信号通过三个卷积层的卷积操作,逐步将数据升维,提取出浅层特征;s2下采样模块中的浅层特征增强模块对提取出的浅层特征进行增强操作,并输出;s3下采样模块中的特征自生成扩展模块将s2中增强的特征经过卷积运算生成特征,该特征经过线性运算,生成一个维度大小相同的特征,二者堆叠成一个新的特征,堆叠成新的特征重复上述的操作后,进行深层特征提取;s4跨通道特征增强模块对s3中线性运算生成的特征输出,利用线性变换实现特征自生成扩展,这个过程降低了参数量,减少了计算量,作为代价,舍弃了特征之间的部分跨通道信息,跨通道特征增强模块将弥补步s3中所丢失的信息;s5上采样模块中的特征自生成信号恢复模块进行重建音频信号,包括以下步骤:特征自生成信号恢复模块对跨通道特征增强模块输出的特征做四分之一的特征通道数压缩后,再进行线性计算依次生成自身三倍的特征,最后将生成的特征与压缩特征进行堆叠生成最终特征,最终特征再通过亚像素卷积的反卷积方式进行上采样,进而达到信号恢复的目的,通过四个特征自生成信号恢复模块对信号特征进行处理,最终达到重建音频信号。

全文数据:

权利要求:

百度查询: 湖南工商大学 一种基于UNET架构的语音带宽扩展方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。