广东海聊科技有限公司查徐鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东海聊科技有限公司申请的专利基于自监督学习的语音情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116434782B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211524793.8,技术领域涉及:G10L25/63;该发明授权基于自监督学习的语音情感识别方法是由查徐鹏;颜志威;马炎南;赵欢;黄念鑫设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。
本基于自监督学习的语音情感识别方法在说明书摘要公布了:本发明公开了一种基于自监督学习的语音情感识别方法,包括获取现有的语音数据集样本;对样本数据进行采样和预处理得到有标签语音数据集;对有标签语音数据集进行数据增强得到有标签混合语音数据集;采用卷积神经网络处理有标签混合语音数据集得到语音数据的高级语义特征信息;采用注意力机制处理高级语义特征信息得到语音数据的全局特征信息;采用插入查询和注意力机制处理全局特征信息得到语音数据的局部特征信息;处理局部特征信息得到最终的语音情感识别结果。本发明能够提取语音数据的全局特征信息,解决了当前语音情感识别领域标签数据的稀缺所导致模型性能差、泛化性低的问题;可靠性高、精确性好,性能较好,适用范围广。
本发明授权基于自监督学习的语音情感识别方法在权利要求书中公布了:1.一种基于自监督学习的语音情感识别方法,包括如下步骤: S1.获取现有的语音数据集样本; S2.对步骤S1获取的样本数据进行采样和预处理,得到有标签语音数据集; S3.对步骤S2得到的有标签语音数据集进行数据增强,从而得到有标签混合语音数据集;具体包括如下步骤: 在步骤S2得到的有标签语音数据集中,任意选取两个不同类别的语音数据,通过VMixup技术构建若干个混合语音样本,从而对有标签语音数据集进行扩充,得到有标签混合语音数据集; 其中,所述的通过VMixup技术构建若干个混合语音样本,具体包括如下步骤: A.从有标签语音数据集中,任意选取两个不同类别的语音数据样本x1和x2,语音数据样本的长度依次为|x1|和|x2|,|x1|=|x2|且等于采样帧数;同时获取语音数据样本x1所对应的情感类别标签y1、语音数据样本x2所对应的情感类别标签y2;设定超参数α∈{α1,α2,...,αn}和随机选取超参数β1∈[0,β1max]和β2∈[0,β2max],其中α1~αn均小于1,β1max<1,β2max<1; B.采用如下算式对语音数据样本x1和x2进行融合操作: 式中αx1表示在语音样本x1中截取第β1*|x1|帧至第α+β1*|x1|-1帧的语音特征片段,算式表达为αx1=x1[β1*|x1|:α+β1*|x1|-1];1-αx2表示在语音样本x2中删除第β2*|x2|帧至第α+β2*|x2|-1帧的语音特征片段后的语音片段,算式表达为1-αx2=x2[1:β2*|x2|-1]+x2[α+β2*|x2|:|x2|];为融合后的混合语音样本,表示将语音特征片段αx1插入到语音片段x2[1:β2*|x2|-1]和x2[α+β2*|x2|:|x2|]之间;αy1表示语音样本x1所对应的情感类别标签y1的α倍;1-αy2表示语音样本x2所对应的情感类别标签y2的1-α倍;为混合语音样本的所对应的情感类别标签; C.将得到的混合语音样本对应的情感类别标签和混合语音样本的附加信息β2,α+β2一同加入有标签语音数据集中; D.重复步骤B和步骤C共n次,每一次重复时取不同的α值; E.对有标签语音数据集中的每一个原始的语音样本都添加一个附加信息0,0,并将附加信息作为语音样本的insertposition; F.最终,得到有标签混合语音数据集; S4.采用卷积神经网络对步骤S3得到的有标签混合语音数据集进行处理,得到语音数据的高级语义特征信息; S5.采用注意力机制对步骤S4得到的高级语义特征信息进行处理,得到语音数据的全局特征信息; S6.采用插入查询和注意力机制对步骤S5得到的全局特征信息进行处理,得到语音数据的局部特征信息; S7.对步骤S6得到的局部特征信息进行处理,得到最终的语音情感识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东海聊科技有限公司,其通讯地址为:528200 广东省佛山市南海区狮山镇软件园桃园路南海产业智库城一期B座B326、B328、B330、B331、B332、B333、B334、B336室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。