基于多领域统计特征和改进CNN的含噪语音情感识别方法

导航：龙图腾网> 最新专利技术> 基于多领域统计特征和改进CNN的含噪语音情感识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京邮电大学

摘要：本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法，属于语音识别领域，包括以下步骤：步骤1：首先对语料库中的纯净语音进行加噪处理，其次提取语音信号的相关多领域特征，采用统计函数对已提取的特征进行筛选，降低特征冗余度，得到冗余度低、情感区分度高的多领域统计特征；步骤2：搭建基于语音增强联合约束CNN‑DNN的框架；步骤3：将多领域统计特征作为系统模型的输入，提取与情感分类标签高度相关且对噪声具有鲁棒性的信息，得到输出层的情感分类结果；步骤4：对所提出的一种基于多领域统计特征和语音增强联合约束CNN‑DNN的噪声环境下语音情感识别方法进行性能评估。

主权项：1.一种基于多领域统计特征和改进CNN的含噪语音情感识别方法，其特征在于，包括以下步骤：步骤1：首先对语料库中的纯净语音进行加噪处理，其次提取语音信号的相关多领域特征，即以对情感分类贡献度较高的特征为主，对语音增强贡献度较高的特征为辅，两者融合，生成一组特征集，采用统计函数对已提取的特征进行筛选，降低特征冗余度，得到冗余度低、情感区分度高的多领域统计特征；步骤1-1：在不同信噪比下，读取语音，将噪声与其混合，生成加噪混合语音信号；步骤1-2：对每一句输入的时域连续语音信号进行采样，然后采用预加重、分帧加窗、端点检测技术对语音信号进行预处理，得到预处理后的语音信号；步骤1-3：针对预处理后的语音信号，提取常用于情感分类任务的MFCC、MFCC一阶差分、过零率、RMS、基音频率特征和常用于语音增强的幅度谱特征，两种不同领域特征进行融合，生成一组特征集；步骤1-4：对已提取的特征进行筛选，计算每条输入语音的统计特征，即对一条语音的各帧进行统计，得到包含最大值、最小值、均值、方差和中值的统计特征，将五种统计特征进行拼接融合，得到一组冗余度低，情感贡献度高的多领域统计特征集；步骤2：搭建基于语音增强联合约束CNN-DNN的框架，主任务为噪声环境下的情感分类，次任务为语音增强，得到系统模型；步骤2-1：搭建基于语音增强联合约束CNN-DNN的公用网络，采用三层卷积层、三层最大池化层的CNN结构，其中，CNN提取的深层特征将通过Flatten层；步骤2-2：搭建主任务，即噪声环境下语音情感分类的网络：采用五层DNN结构作为步骤2-1中公共网络的全连接层，分别为输入层、dropout层、隐层、dropout层和输出层，DNN网络与前置公用网络CNN相连接，得到噪声环境下语音情感分类主任务的整体结构；步骤2-3：搭建次任务，即噪声环境下语音增强的网络：采用五层DNN结构作为步骤2-1中公共网络的全连接层，分别为输入层、dropout层、隐层、dropout层和输出层，DNN网络与前置公用网络CNN相连接，得到噪声环境下语音增强次任务的整体结构；步骤2-4：调整前置公用网络CNN与主次任务DNN网络的衔接，使得两个DNN网络呈并联结构，前置公用网络CNN与DNN网络呈串联结构，生成基于语音增强联合约束CNN-DNN的框架；步骤3：将多领域统计特征作为系统模型的输入，用于训练联合约束CNN-DNN模型以提取语音信号的多元化深度特征以及与情感分类标签高度相关，且对噪声具有鲁棒性的信息，得到输出层的情感分类结果；步骤4：对所提出的基于多领域统计特征和改进CNN的含噪语音情感识别方法进行性能评估。

全文数据：

权利要求：

百度查询：南京邮电大学基于多领域统计特征和改进CNN的含噪语音情感识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种面向城市多点爆炸突发事件的应急处置力量分配方法

下一篇：一种快捷准确计算债权会议表决结果的方法及其系统

相关技术

一种面向城市多点爆炸突发事件的应急处置力量分配方法

一种快捷准确计算债权会议表决结果的方法及其系统

一种用于处理生物质气化合成气的非催化转化POX转化炉及处理方法

一种大规格钛合金板材的表面改性方法

一种季铵盐化合物、盐型及其应用

一种污染空气净化方法

用于电气HV连接的触头组件

一种用于非洲地区小样本精细水体遥感提取的对抗样本生成方法

一种结合日志进行客户端仿真方法

一种气象对人和装备的影响效应评估方法

增程器的控制方法、装置和车辆

氢供给装置

CNN相关技术

用于图像阴影检测的CNN模型生成方法、图像阴影检测方法_安徽大学_202410836611.3

一种针对多模态图像的无标签CNN分类性能评估方法_重庆理工大学_202410860551.9

基于CNN-RF模型的遥感地球化学反演方法_吉林大学_202410950940.0

动态多组态CNN加速器架构与操作方法_财团法人工业技术研究院_201911179343.8

基于多领域统计特征和改进CNN的含噪语音情感识别方法_南京邮电大学_202210494189.9

基于Transformer和CNN混合网络的序列图像超分辨率重建方法_合肥工业大学_202410593329.7

基于INFO优化的CNN-BiLSTM超短期光伏发电预测方法_西安理工大学_202411152407.6

基于改进Faster R-CNN的飞机蒙皮缺陷检测的识别方法_江苏航空职业技术学院_202411040396.2

一种基于GWO-CNN-GRU-Attention的高速车辆轨迹预测方法_广西双英集团股份有限公司_202410876451.5

一种基于CNN-LSTM神经网络的采运装备速度协同控制方法_中国矿业大学_202211239379.2

噪相关技术

一种低噪过滤式制氧机_湖南一特医疗股份有限公司_202323111379.7

一种降低骑行风噪的结构_陈邱晗_202420678382.2

一种减噪防震翻袋机_苏州宏特盛机电科技有限公司_202420263104.0

基于谐波带宽拓展和提取的多频段低相噪振荡器_西安电子科技大学_202410880471.X

一种基于仿生关节驱动机理的低噪高效电驱动舵机_重庆大学_202011355363.9

基于光电振荡器的低相噪窄线宽激光信号产生装置及方法_中国科学院半导体研究所_202411012237.1

一种可控低噪负高压发生器_赖涛_202420568744.2

一种能够生成低相噪信号的自适应频率综合器及方法_中国计量科学研究院_202111350014.2

一种含噪图像检索场景下的数据选择方法及装置_西安交通大学_202411035859.6

一种超声相控阵全聚焦去噪成像方法_合肥通用机械研究院有限公司_202411338506.3

含相关技术

一种乳液型粘结剂、含彼之隔膜、含彼之电池及其制备方法_珠海辰玉新材料科技有限公司_202410832805.6

含锗物料中锗的回收方法_有研资源环境技术研究院(北京)有限公司_202410915914.4

一种含RFID标签的轮胎_中策橡胶集团股份有限公司_202420385557.0

一种含DMF废水处理方法_成都瀚川环境科技有限公司_202411206722.2

一种新型含浸生产线_嘉兴诺讯机电科技有限公司_202111150000.6

含杂芳基的化合物_正大天晴药业集团股份有限公司_202410509817.5

处理含铁物料的系统和方法_中国瑞林工程技术股份有限公司_201810066916.5

一种含艾叶炭卫生棉条_上海东利大健康研究院有限公司_202323203135.1

一种含氟硅渣的利用方法_多氟多新材料股份有限公司_202411008126.3

一种含分道进水阀的马桶_福建良瓷科技有限公司_202310460173.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多领域统计特征和改进CNN的含噪语音情感识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务