一种基于稀疏分解的齿音抑制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明属于数字音频处理技术领域，具体提供一种基于稀疏分解的齿音抑制方法，用以解决现有齿音抑制方法由于没有对齿音和有用语音进行细粒度的区分、导致在抑制齿音时带来可感知的有用语音信息损失的问题。本发明包括齿音字典构建和齿音抑制两个阶段，该方法提取训练齿音音频帧的频谱，将齿音频率段的频谱幅度数据作为训练数据，采用稀疏字典训练方法，训练生成齿音字典，在此字典上，对提取的测试音频数据以帧为单位进行稀疏分解，利用残差矢量的能量来确定分解的原子数目，并根据分解系数的大小对齿音和有用语音进行了细粒度区分，同时通过保留残差信号的方式来去除齿音成分，从而在保持原语音信息的基础上，有效地抑制了音频中的齿音。

主权项：1.一种基于稀疏分解的齿音抑制方法，其特征在于，包括齿音字典构建和齿音抑制两个阶段；所述齿音字典构建包括以下步骤：A1.生成齿音样本；A1-1.初始化齿音特征矩阵F为空；A1-2.根据齿音训练音频生成齿音特征矩阵F，针对每一个齿音训练音频作：A1-2-1.将音频数据按固定长度划分为各音频帧，相邻帧间有重叠，得到N个音频帧；并对各音频帧数据进行加窗处理，再进行短时傅里叶变换，得到其对应的频谱；A1-2-2.设频谱幅度数据中对应每个时刻共有M+1个数据，则分别计算采样频率点m5000与m10000：其中，为向下取整运算，fmax为最高频率；A1-2-3.对每一个音频帧作：对第n、1≤n≤N个音频帧，将采样频率点m5000到m10000的幅度数据排列构成列矢量并归一化得到特征矢量fn，将fn按列追加到齿音特征矩阵F中；A2.构建齿音字典：设定字典大小为K，将齿音特征矩阵F中的特征矢量作为训练数据，采用稀疏字典训练方法，训练生成齿音字典D；所述齿音抑制包括以下步骤：B1.生成测试样本；B1-1.初始化测试矩阵F′为空；B1-2.根据待处理音频生成测试矩阵F′，具体为：B1-2-1.将待处理音频数据按固定长度划分为各音频帧，相邻帧间有重叠，得到N′个音频帧；并对各音频帧数据进行加窗处理，再进行短时傅里叶变换，得到其对应的频谱，其中，第n个音频帧的频谱幅度数据为en；B1-2-2.对每一个音频帧作：对第n、1≤n≤N′个音频帧，将采样频率点m5000到m10000的幅度数据排列构成列矢量fn′，将fn′按列追加到测试矩阵F′中；B2.稀疏齿音分解；B2-1.定义长度为N′的类别标签数组S；B2-2.对每一个音频帧作：B2-2-1.在齿音字典D下，对F′的第n列矢量fn′进行稀疏分解，得到k个原子和残差矢量其中，dj和cj分别为选择的第j个原子与其对应的权重系数，k为满足如下公式的最小整数：其中，和分别为残差矢量和的各元素平方和；B2-2-2.搜索k个权重系数cj、1≤j≤k中的最大值cmax，根据cmax对类别标签数组S的第n个元素S[n]赋值：其中，T为预设的权重系数阈值；B3.去除齿音成分：B3-1.初始化n＝1；B3-2.对S[n]进行判决：若S[n]＝1，则更新频谱幅度数据en的第m5000个至第m10000个元素：其中，为的第m-m5000+1个元素，ElementAbsx表示对矢量x的每一个元素取绝对值的操作；否则，转到步骤B3-3；B3-3.更新n为n+1，并判断n是否大于N′，若是，转到步骤B3-4；否则，转到步骤B3-2；B3-4.使用更新后的频谱数据进行短时傅里叶逆变换，得到处理后的音频。

全文数据：

权利要求：

百度查询：电子科技大学一种基于稀疏分解的齿音抑制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种新型数据线缆及其接口装置

下一篇：显示装置

相关技术

一种新型数据线缆及其接口装置

显示装置

一种高安全性的并机并网的储能设备

一种MOCVD设备的尾气过滤器结构和使用方法

基于WO₃@AuNPs和聚合物PAMAM双信号放大的DR1检测试剂盒及应用

一种纯水中超快激光烧蚀制备高活性纳米氧化银析氢材料的方法

一种铜光催化未活化卤代烃胺化制备氮烷基化化合物的方法

基于私有传输协议的文件传输方法、装置和存储介质

一种公路深层病害双组分高聚物抽拔注浆加固装置及方法

半固态电解质膜及其制备方法、二次电池

一种基于多链融合的药品溯源系统和方法

一种带有光路定向机构的车载顶灯

稀疏相关技术

稀疏样本显微成像的自动对焦方法、装置和计算机设备_中国人民解放军国防科技大学_202410797506.3

用于压缩和解压缩稀疏数据集合的方法和装置_微软技术许可有限责任公司_202280091530.4

一种基于稀疏表情优化人脸关节驱动模型的方法_浙江大学_202410435219.8

一种基于分组稀疏性的高光谱图像波段选择方法_哈尔滨师范大学_202410716643.X

基于块稀疏贝叶斯学习的非均匀杂波抑制方法_中国人民解放军空军工程大学_202411008701.X

基于硬件感知稀疏性模式加速深度学习推理的方法和装置_英特尔公司_202280090866.9

基于移动和终端设备采集识别稀疏型点阵码的方法与系统_中科微点技术有限公司_202410686845.4

基于低秩组稀疏表示的天波超视距雷达杂波抑制方法_中国人民解放军国防科技大学_202410872996.9

基于联合稀疏模型的海洋可控源电磁数据降噪方法及系统_中南大学_202210467906.9

一种加速图神经网络中稀疏-稠密矩阵乘的自适应边采样方法_西南科技大学_202410713500.3

分解相关技术

交联橡胶的分解方法_株式会社普利司通_202380020659.0

一种臭氧分解罐_大连祥丰石化装备有限公司_202420318654.8

液体收纳容器以及液体收纳容器的分解方法_精工爱普生株式会社_202410305214.3

一种车辆悬架载荷分解方法及系统_东风汽车集团股份有限公司_202111382075.7

一种促进枇杷叶凋落物分解的腐解剂及促进枇杷叶凋落物分解的方法_生态环境部卫星环境应用中心_202311622726.4

基于Retinex分解和双分支标准流网络的弱光图像增强方法_西安理工大学_202410759526.1

基于改进辛几何模态分解的滚动轴承复合故障诊断方法_兰州理工大学_202410700485.9

全氟化合物分解催化剂及其制备方法_喜星触媒株式会社_202410125982.0

一种非侵入式负荷实时分解方法及系统_国网江苏省电力有限公司信息通信分公司_202210757630.8

一种基于部分解Caching与重用的符号执行优化方法_中国人民解放军国防科技大学_202210259487.X

方法相关技术

记录方法_精工爱普生株式会社_202410329157.2

分类方法_株式会社半导体能源研究所_202080059927.6

分离方法_大金工业株式会社_202380021486.4

唤醒信号的接收方法、发送方法、配置方法、装置及设备_OPPO广东移动通信有限公司_202280091619.0

原版、确定原版的图案的方法、曝光的方法、以及制造物品的方法_佳能株式会社_202410311669.6

信号传输方法、信号检测方法、装置及通信设备_维沃移动通信有限公司_202310304876.4

验证方法_上海兆芯集成电路股份有限公司_202011127602.5

接入处理方法、信息处理方法、配置发送方法及设备_维沃移动通信有限公司_202310290704.6

训练SEM图像选择方法及使用该方法的SEM设备对准方法_三星电子株式会社_202410252998.8

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于稀疏分解的齿音抑制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务