南京邮电大学张晖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利面向智能驾驶的驾驶人声音情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115227246B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210802515.8,技术领域涉及:A61B5/18;该发明授权面向智能驾驶的驾驶人声音情感识别方法是由张晖;孙恩东;赵海涛;朱洪波设计研发完成,并于2022-07-07向国家知识产权局提交的专利申请。
本面向智能驾驶的驾驶人声音情感识别方法在说明书摘要公布了:本发明公开了面向智能驾驶的驾驶人声音情感识别方法,包括:采集不同用户在驾驶场景下包含不同情绪的声音数据,构建驾驶人三维声音特征数据集;然后构建基于三维声音特征的聚类多模型训练方法,通过基于三维声音特征的聚类方法得到不同人员类别的样本用户,进而利用不同人员类别的样本用户数据训练高斯混合模型,形成面向不同人员类别的声音情感识别模型;之后使用者在初始化时输入正常情绪状态下的声音进行初始化归类,得到通用的基准模型和基准参数;最后在运行识别阶段输入实时采集的使用者的声音,声音样本经过基准模型后将其再输入其他模型中进行多模态信息融合并做判断,最终输出识别结果。本发明提高了智能驾驶场景下的情感识别的准确性。
本发明授权面向智能驾驶的驾驶人声音情感识别方法在权利要求书中公布了:1.面向智能驾驶的驾驶人声音情感识别方法,其特征在于,具体包括如下步骤: 步骤1:在驾驶场景中采集不同用户在Q种不同情绪状态下的声音数据,并构建每个用户的三维声音特征数据集; 步骤2:采用聚类方法在构建的三维声音特征数据集中找到K个聚类中心{o1,o2,...,ok,...,oK},ok表示第k个聚类中心,k=1,2,…,K;采用K个聚类中心训练高斯混合模型,得到与K个聚类中心对应的K个高斯混合模型{G1,G2,...,Gk,....,GK},Gk表示第k个高斯混合模型; 步骤3:使用者在初始化时输入正常情绪状态下的声音,根据该声音与每个聚类中心的距离,得到初始化时使用者输入正常情绪状态下的声音对应的最优聚类中心k*;将k*对应的高斯混合模型作为基准模型计算的性能指标 步骤4:驾驶过程中实时采集使用者的声音,将当前采集到的声音输入至Gk*中,得到Q种情绪状态的概率其中q表示第q种情绪状态,q=1,2,…,Q,表示输出的第q种情绪状态的概率;记最大概率对应的情绪状态为classq*; 步骤5:计算第q种情绪状态下当前采集到的声音与所有聚类中心的最短距离;将最短距离对应的聚类中心记为对应的高斯混合模型记为得到每种情绪状态对应的聚类中心集合以及每个聚类中心对应的高斯混合模型集合将当前采集到的声音输入至中,得到输出的Q种情绪状态的概率最大概率记为最大概率对应的情绪状态记为并计算的性能指标 步骤6:根据性能指标和性能指标判断当前使用者的情绪状态; 步骤1具体为:对每个用户在第q种情绪状态下的声音数据进行分帧和加窗处理;并根据如下公式计算每一帧所包含的能量: En=xn2*ωn2 其中En为第n帧的能量,xn为帧信号,ωn为汉明窗; 按照如下公式对每个用户在第q种情绪状态下的所有帧信号进行分类: 其中,t表示帧类别,t=1,2,3,4;Et表示第t个帧类别对应的帧能量的范围; 计算每个用户在第q种情绪状态下第t个帧类别的时间比例lt; 其中,Timet表示用户在第q种情绪状态下第t个帧类别总时长; 计算每个用户在第q种情绪状态下的短时平均频率a1、短时均方差频率a2和共振峰频率a3,得到用户在第q种情绪状态的融合韵律特征m: m=w1·a1+w2·a2+w3·a3 其中,w1、w2和w3均表示相对重要性; 将Q种情绪状态,用户在Q种情绪状态下第t个帧类别的时间比例lt,以及用户在第q种情绪状态下的融合韵律特征m组成用户的三维声音特征数据集; 所述步骤3中根据如下公式计算性能指标 其中,表示使用者初始化时正常情绪状态下的声音进入中得到正常情绪状态的概率,d*表示使用者初始化时输入的声音数据与最优聚类中心k*的距离; 步骤5中根据如下公式计算高斯混合模型集的性能指标 其中,表示当前使用者的声音在第q种情绪状态下与聚类中心之间的距离。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。