东南大学郑文明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于注意力时频网络的语音情感识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114898778B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210534999.2,技术领域涉及:G10L25/63;该发明授权基于注意力时频网络的语音情感识别方法及系统是由郑文明;路成;宗源;李溯南;连海伦;唐传高;赵焱设计研发完成,并于2022-05-17向国家知识产权局提交的专利申请。
本基于注意力时频网络的语音情感识别方法及系统在说明书摘要公布了:本发明公开了一种基于注意力时频网络的语音情感识别方法及系统,本发明首先通过样本特征提取模块获取的对数梅尔频谱特征鲁棒性更好,然后通过时频注意力网络和编码器获得具有与异常噪声如背景噪声、说话人身份、语种等无关但与情感有关的泛化性的特征,最后利用情感分类器模块进一步增强获得特征的情感判别性和与噪声无关的泛化性,本发明识别效果更好、识别率更高。
本发明授权基于注意力时频网络的语音情感识别方法及系统在权利要求书中公布了:1.基于注意力时频网络的语音情感识别方法,其特征在于,包括如下步骤: 1获取若干情感语音样本,进行短时离散傅里叶变换后再经梅尔滤波器组后取对数获得对数梅尔频谱特征,作为网络的输入; 2将训练样本的对数梅尔频谱特征输入基于注意力的频域编码器获得加权频域语音情感特征;具体包括如下步骤: 2-1将训练样本的对数梅尔频谱特征输入频域注意力网络得到频域注意力af; 2-2将频域注意力af与频域特征x做广播乘积后与原频域特征x按通道加权后求均值得到加权频域特征x′; 2-3频域注意力网络包含一个卷积模块、一个乘积模块和一个求和模块,其中卷积模块均包含一个卷积模块操作,乘积模块包含一个广播乘积操作,求和模块包含一个加法操作; 3将加权频域语音情感特征输入基于注意力的时域编码器获得加权时域语音情感特征,即时频语音情感特征; 4对时频语音情感特征经过情感分类器进行分类; 5对基于注意力的频域编码器、基于注意力的时域编码器和情感分类器进行联合训练,得到最优模型参数; 6将待识别的情感语音样本输入训练好的基于注意力的频域编码器、基于注意力的时域编码器和情感分类器,得到识别出的语音情感。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励