Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 河南工业大学庄志豪获国家专利权

河南工业大学庄志豪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉河南工业大学申请的专利一种基于多任务学习和子域自适应的跨库语音情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113870900B

龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111125098.X,技术领域涉及:G10L25/63;该发明授权一种基于多任务学习和子域自适应的跨库语音情感识别方法是由庄志豪;刘曼;白雪杰;单帅;陶华伟;傅洪亮设计研发完成,并于2021-09-25向国家知识产权局提交的专利申请。

一种基于多任务学习和子域自适应的跨库语音情感识别方法在说明书摘要公布了:本发明提出了一种基于多任务学习和子域自适应的跨库语音情感识别方法,本发明包括以下步骤:首先,源域和目标域提取的高维语音特征分别输入深度自编码网络,压缩特征冗余信息,获取低维情感特征;然后,采用子域自适应算法将低维特征空间分别划分成情感子域特征空间和性别子域特征空间,以此来减小特征分布距离;最后,将情感识别作为主任务,性别识别作为辅助任务,学习更多共性情感信息。本发明提出的方法可以有效提升跨库语音情感识别性能。

本发明授权一种基于多任务学习和子域自适应的跨库语音情感识别方法在权利要求书中公布了:1.一种基于多任务学习和子域自适应的跨库语音情感识别方法,其特征在于,包括以下步骤: 1特征预处理:首先选取源域语料库和目标域语料库具有相同情感类别的数据分别作为训练集和测试集,然后提取他们的声学特征,对其进行归一化处理; 2特征处理:将步骤1归一化之后得到的源域和目标域特征分别输入深度自编码器,压缩特征冗余信息,得到表征力强的低维情感特征,假设深度自编码的输入为X,解码输出为则深度自编码器的重构损失如下: 从而获取源域和目标域在低维空间中的情感表示;同时使用源域真实的情感标签和性别标签作交叉熵来优化子域空间的划分,交叉熵计算如下: 其中为预测概率; 3子域特征分布对齐:采用局部最大均值误差localmaximummeandiscrepancy,LMMD分别将子域特征空间划分为情感子域特征空间和性别子域特征空间,情感子域特征分布对齐算法表达为: 其中为深度自编码器编码输出的源域低维特征中每个特征属于情感类别c的权重,为深度自编码器编码输出的目标域低维特征中每个特征属于情感类别c的权重,同时对齐情感的属性特征即性别,性别子域特征分布对齐为: 其中为源域低维特征中每个特征属于性别类别a的权重,为目标域样本中每个特征属于性别类别a的权重; 4训练模型:整个网络训练是通过Adam优化器不断优化训练的,由源域的情感标签和性别标签分别计算交叉熵来优化步骤3子域空间的准确划分,整个网络的损失函数表示为: Lsum=LRS+LRT+LE+LG+Lemotion+Lgender6 其中LRS和LRT分别是深度自编码器的重构损失,LE和LG分别是源域特征的情感信息交叉熵损失和性别信息交叉熵损失,Lemotion和Lgender分别是基于LMMD的情感子域特征分布距离以及性别子域特征分布距离; 6重复步骤2、3,通过梯度下降法迭代训练网络模型,不断减小步骤5的损失函数,直至模型最优; 7利用步骤6训练好的网络模型,使用sofmatx分类器识别步骤1中未加噪的目标域特征,最终实现语音情感在跨语料库条件下的情感识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河南工业大学,其通讯地址为:450001 河南省郑州市高新技术产业开发区莲花街100号河南工业大学科技处;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。