恭喜东南大学宗源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东南大学申请的专利基于隐式对齐子空间学习的跨库语音情感识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115035915B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210605389.7,技术领域涉及:G10L25/63;该发明授权基于隐式对齐子空间学习的跨库语音情感识别方法及装置是由宗源;常洪丽;郑文明;路成;朱洁;唐传高;赵焱设计研发完成,并于2022-05-31向国家知识产权局提交的专利申请。
本基于隐式对齐子空间学习的跨库语音情感识别方法及装置在说明书摘要公布了:本发明公开了一种基于隐式对齐子空间学习的跨库语音情感识别方法及装置,方法包括:1获取两个语音情感数据库,分别作为训练数据库和测试数据库;2对训练数据库和测试数据库中的每个语音样本提取语音特征;3建立联合分布隐式对齐子空间学习模型4根据语音样本的语音特征对所述学习模型进行学习,得到语料不变投影矩阵U的最优值5对于待识别语音,按照步骤2得到语音特征,并采用学习到的得到对应的情感类别。本发明识别准确率更高。
本发明授权基于隐式对齐子空间学习的跨库语音情感识别方法及装置在权利要求书中公布了:1.一种基于隐式对齐子空间学习的跨库语音情感识别方法,其特征在于该方法包括:1获取两个语音情感数据库,分别作为训练数据库和测试数据库,其中,训练数据库中包含有若干语音样本和对应的情感类别标签,测试数据库中包含若干语音样本;2对训练数据库和测试数据库中的每个语音样本提取语音特征;3建立联合分布隐式对齐子空间学习模型: 其中U是待学习得到的语料不变投影矩阵,W表示重构系数矩阵,Wi表示第i个情感类别的重构系数矩阵,i表示情感类别序号,f1U表示与情感识别能力相关的简单组稀疏线性回归损失,μ表示控制两项之间平衡的权衡参数,f2U,W,Wi表示语料库的不变性能力函数;4根据语音样本的语音特征对所述学习模型进行学习,得到语料不变投影矩阵U的最优值5对于待识别语音,按照步骤2得到语音特征,并采用学习到的得到对应的情感类别;其中,所述联合分布隐式对齐子空间学习模型中的f1U的函数具体为: 式中,λ是权衡参数,表示训练数据库语音样本的语音特征形成的特征矩阵,表示训练数据库第k个语音样本的语音特征,d是描述语音信号的声学特征向量的维数,ns为训练数据库中语音样本的数量,是Xs对应的标签形成的标签矩阵,c表示跨语料库情感识别中涉及的情感总数,Ls的每一列是一个独热编码向量,用l=[l1,…,lc]表示,如果该列对应的语音样本属于第i个情感,则第i个表项li的值设为1,其余项均设为0;f2U,W,Wi的函数具体为: 式中,表示测试数据库语音样本的语音特征形成的特征矩阵,表示测试数据库第j个语音样本的语音特征,nt为测试数据库语音样本数量,τ为权衡参数,为第j个测试样本对应的重构系数向量;表示Xs中属于第i个情感类别的语音特征组成的特征向量,表示Xs中属于第i个情感类别的语音特征数量,且表示Xt中属于第i个情感类别的语音特征组成的特征向量,表示Xt中属于第i个情感类别的语音特征数量,且其中,步骤4具体包括:4-1对语料不变投影矩阵U进行初始化;4-2基于语料不变投影矩阵U采用下式预测测试数据库语音样本的情感类别标签emotion_label,然后根据预测的情感类别标签emotion_label的所属的情感类别序号i确定和 为语音情感类别标签的第i项;4-3求解联合分布隐式对齐子空间学习模型,过程如下:A、根据确定的和固定W和Wi,将学习模型简化为如下形式并进行求解,得到U; 式中,Δ0=Xt-XsW,和L=[Ls,00,01,…,0c],00和0i是条目全为0且大小与Δ0和Δi相同的矩阵,i=1,...,c;B、根据得到的U,固定U,将学习模型分为以下两个独立的优化模型并进行求解,得到W和Wi: 该式中W和Wi的第j列wj和的最优解是通过使用SLEP包解决以下两个典型LASSO问题得到的: 式中,和C、检查W和Wi是否收敛,若收敛,则将此时的U值作为最优结果输出,否则返回步骤4-2进行循环;其中,步骤5具体包括:对于待识别语音,按照步骤2得到语音特征按照下式得到情感类别: 式中,为语音情感类别标签的第i项。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。