恭喜浙江工业大学毛科技获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工业大学申请的专利一种基于神经网络的语音情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114495989B 。
龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210216452.8,技术领域涉及:G10L25/63;该发明授权一种基于神经网络的语音情感识别方法是由毛科技;毛严;钱升港;武佳男;程燃设计研发完成,并于2022-03-07向国家知识产权局提交的专利申请。
本一种基于神经网络的语音情感识别方法在说明书摘要公布了:一种神经网络的语音情感识别方法,包括:步骤1语音特征MFCC的获取;步骤2输入本发明中设计的基于神经网络的语音情感识别网络进行语音情感识别;步骤3获得语音情感识别结果。本发明利用神经网络对语音信号进行情感识别,设计并实现了一个基于神经网络的语音情感识别网络,在进行语音情感识别时,仅需输入待识别的语音信号,即可得到识别的语音情感。对于输入的语音信号,语音情感识别网络能够自适应地提取出其中包含丰富情感信息的语音特征,利用情感特征来进行精确地语音情感识别。该发明对所有人都能进行准确地语音情感识别,具有较大地应用价值。
本发明授权一种基于神经网络的语音情感识别方法在权利要求书中公布了:1.一种基于神经网络的语音情感识别方法,包括以下步骤:步骤1:获取语音特征参数;具体包括:1使用python库函数python_speech_features.mfcc函数读取待语音信号中的MFCC特征系数;2使用python库函数python_speech_features.delta函数读取语音信号的一阶差分MFCC特征系数和二阶差分MFCC特征系数;3使用python库函数numpy.hstack函数将三种语音特征参数进行拼接,将语音特征转化为199*39的大小,对所有待评估的语音信号都使用相同的大小;4使用python库函数transforms.ToTensor将特征数据转化为Tensor向量,以供后续的语音情感识别网络使用;步骤2:输入语音特征参数进行语音情感的分析;所述的语音情感识别网络包括特征提取器、关键特征选择子网和识别子网:所述的特征提取器使用卷积神经网络CNN结合双向长短记忆网络BILSTM作为特征提取器进一步提取语音信号的特征;经过特征提取器,卷积神经将语音特征中进行降维处理,长短记忆网络使得语音信号特征具有连续性,最后生成新的关键特征,输出的特征表示为H={h1,h2,…,hL};所述的关键特征选择子网根据特征提取器所提取出的语音特征,进一步选取出语音特征中具有关键信息量的特征,即具有关键特征的区域;关键特征选择子网的输入为特征提取器所生成的降维特征,对这些特征,采用了ATTENTION注意力机制网络,对语音情感特征的重要性进行打分,将重点聚焦与语音情感特征突出的部分,选择出具有关键信息量的特征,如公式1所示: 其中K、Q、V分别代表输入特征的关键特征、查询值和当前关键特征的权重数值;第一步计算每个查询值和各个关键特征的相关性得到对应的权重系数,表示为Si;第二步使用Softmax函数进行归一化处理,其中Lx代表特征数据的长度,如公式2所示; 第三步,将权重系数和对应的当前关键特征的权重数值进行加权求和,从而得到最后的注意力数值,如公式3所示; 评估子网进行语音情感评估;对于输入的语音信号,特征提取器提取出语音信号的特征,关键特征选择子网选出语音信号具有突出情感信息量的关键特征;通过特征提取器提取出语音特征,经过两层全连接层和softmax层,得到最终的语音情感分类结果;步骤3:获得语音情感评估结果;在进行语音情感分析时,将语音情感分成生气,悲伤,高兴,害怕,中性,厌恶和无聊,共7种情感类型;待评估的语音信号输入到语音情感识别网络后,会输出其对应的情感类型,情感类型的范围在所述7种情感类型之间。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。