一种完全端到端的多模态对话情感识别方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华中师范大学

摘要：本发明公开了一种完全端到端的多模态对话情感识别方法及系统。该方法包括步骤：以话语为单位对视频文件进行话语分割，得到多个子视频；分别从每个子视频提取每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征；对每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征进行跨模态融合；分别将目标子视频的话语与自我历史话语和他人历史话语进行时序建模，最后将两者进行融合，作为最终的时序建模特征输出和后续的线性分类器输入。本发明充分利用了多模态的特征，并考虑了说话人自身的情感变化以及说话人之间的情感迁移，大大提升了情感识别的正确率和鲁棒性。

主权项：1.一种完全端到端的多模态对话情感识别方法，其特征在于，包括步骤：获取对话场景下的视频文件，以话语为单位对视频文件进行话语分割，得到多个子视频，每个子视频中标记了该子视频对应的说话人标识；分别从每个子视频提取每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征；对每个子视频的视频模态时序特征、音频模态时序特征和文本模态时序特征进行跨模态融合，获得每个子视频的第一融合特征；根据每个子视频的说话人标识，利用注意力机制根据每个子视频的第一融合特征与该子视频说话人自身历史特征获得自我历史话语特征，利用注意力机制根据每个子视频的第一融合特征与该子视频说话人之外的他人历史特征获得他人历史话语特征，对每个子视频的自我历史话语特征和他人历史话语特征进行融合，获得第二融合特征；根据每个子视频的第二融合特征输出每个子视频的情感识别结果。

全文数据：

权利要求：

百度查询：华中师范大学一种完全端到端的多模态对话情感识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可调节的建筑工程用测量设备

下一篇：一种内置限位模块的PET塑料内托

相关技术

一种可调节的建筑工程用测量设备

一种内置限位模块的PET塑料内托

一种钢板自动切割装置

一种带温度监测功能的配电柜

一种新能源车辆防爆充电桩

一种钢筋生产中的钢筋推送装置

一种水利巡河安全警报组件

肱动脉穿刺术后肘关节制动装置

一种高精度工业废气自动监测装置

防窃电计量箱

一种混凝土抗水检测装置

一种压滤机滤板油缸液压系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种完全端到端的多模态对话情感识别方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务