首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多尺度残差注意力的语音压缩方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)

摘要:本发明属于语音信号处理技术领域,提供了一种基于多尺度残差注意力的语音压缩方法及系统,包括获取语音信号;对语音信号进行卷积操作,得到第一特征,对第一特征进行操作,得到第一特征的残差和恒等映射;将残差和恒等映射相加得到第一输出特征,对第一输出特征进行特征提取,经过多次操作得到注意力分数,将注意力分数分别与残差和恒等映射相乘,经过多次操作得到第三输出特征;对第三输出特征进行多级迭代量化,得到第一矢量,第二网络根据接收到的第一矢量的索引,在码本中找到相应的量化矢量,将所有量化矢量相加,得到重构矢量;对重构矢量解码输出合成语音,并对生成语音的真伪通过判别器进行判断。本发明能够提高合成语音的质量。

主权项:1.基于多尺度残差注意力的语音压缩方法,其特征在于,包括以下步骤:S1获取低速率下的多帧语音信号;S2将语音信号输入第一网络中进行卷积操作,得到第一特征,对第一特征进行多次操作,得到第一特征的残差和第一特征的恒等映射;对第一特征进行多次操作,得到第一特征的残差,具体为:对第一特征进行两组卷积核大小分别为三和五的卷积操作,并将组间卷积两两相乘,对卷积后的特征进行拼接,经过一维卷积进行多尺度融合,得到第一特征的残差;S3将残差和恒等映射相加得到第一输出特征,提取第一输出特征的全局和局部特征,根据全局和局部特征得到融合特征,对融合特征进行操作,得到融合特征的注意力分数,将注意力分数分别与残差和恒等映射相乘,并将得到的两个结果相加得到第二输出特征;S4将第二输出特征输入全波段特征提取器中,得到第三输出特征;S5对第三输出特征进行多级迭代量化,得到第一矢量,将第一矢量的索引传输到第二网络,第二网络根据接收到的索引,在码本中找到相应的量化矢量,将所有量化矢量相加,得到重构矢量;S6对重构矢量解码输出合成语音,并对生成语音的真伪通过判别器进行判断。

全文数据:

权利要求:

百度查询: 山东省计算中心(国家超级计算济南中心) 齐鲁工业大学(山东省科学院) 基于多尺度残差注意力的语音压缩方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。