首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种完全端到端的多模态对话情感识别方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华中师范大学

摘要:本发明公开了一种完全端到端的多模态对话情感识别方法及系统。该方法包括步骤:以话语为单位对视频文件进行话语分割,得到多个子视频;分别从每个子视频提取每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征;对每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征进行跨模态融合;分别将目标子视频的话语与自我历史话语和他人历史话语进行时序建模,最后将两者进行融合,作为最终的时序建模特征输出和后续的线性分类器输入。本发明充分利用了多模态的特征,并考虑了说话人自身的情感变化以及说话人之间的情感迁移,大大提升了情感识别的正确率和鲁棒性。

主权项:1.一种完全端到端的多模态对话情感识别方法,其特征在于,包括步骤:获取对话场景下的视频文件,以话语为单位对视频文件进行话语分割,得到多个子视频,每个子视频中标记了该子视频对应的说话人标识;分别从每个子视频提取每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征;对每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征进行跨模态融合,获得每个子视频的第一融合特征;根据每个子视频的说话人标识,利用注意力机制根据每个子视频的第一融合特征与该子视频说话人自身历史特征获得自我历史话语特征,利用注意力机制根据每个子视频的第一融合特征与该子视频说话人之外的他人历史特征获得他人历史话语特征,对每个子视频的自我历史话语特征和他人历史话语特征进行融合,获得第二融合特征;根据每个子视频的第二融合特征输出每个子视频的情感识别结果。

全文数据:

权利要求:

百度查询: 华中师范大学 一种完全端到端的多模态对话情感识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。