重庆市信息通信咨询设计院有限公司张晓琴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆市信息通信咨询设计院有限公司申请的专利一种跨模态融合与对比学习的多模态对话情感识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121278070B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511841047.5,技术领域涉及:G06F16/3331;该发明授权一种跨模态融合与对比学习的多模态对话情感识别方法及系统是由张晓琴;杨馨设计研发完成,并于2025-12-09向国家知识产权局提交的专利申请。
本一种跨模态融合与对比学习的多模态对话情感识别方法及系统在说明书摘要公布了:本发明涉及自然语言处理技术领域,具体涉及一种跨模态融合与对比学习的多模态对话情感识别方法与系统。本发明通过跨模态编码器引入可学习残差缩放与预归一化,稳定文本、语音与视觉模态的深层交互,抑制梯度爆炸;通过语义‑时序图增强模块在线构建融合语义相似性与时间邻近性的对话图,利用图注意力网络显式建模远距离轮次依赖与跨说话人情绪传递;通过自适应对比对齐模块采用动态调度的对比损失与指数滑动平均更新的模态‑情绪原型库,实现数据分布自适应的跨模态对齐;本发明通过上述模块的协同工作,解决了现有技术中存在的跨模态融合不稳定、长距离与跨说话人依赖建模不足,以及跨数据集对齐能力弱的问题。
本发明授权一种跨模态融合与对比学习的多模态对话情感识别方法及系统在权利要求书中公布了:1.一种跨模态融合与对比学习的多模态对话情感识别系统,其特征在于,包括: 特征提取模块,用于提取对话中的多模态特征;其中,所述多模态特征包括文本模态、视觉模态和音频模态; 跨模态编码器模块,用于对所述多模态特征进行深层交互融合,得到融合后特征序列;其中,所述跨模态编码器模块包括多个编码层,每个编码层依次包括自注意力层、跨模态多头自注意力层和前馈网络层,并在自注意力层中采用预归一化和可学习残差缩放系数以稳定训练;在跨模态多头自注意力层中,文本模态接收视觉模态和音频模态的双路输出,拼接后通过线性映射回注,视觉模态和音频模态分别接收文本模态的单路输出回注; 语义-时序图增强模块,用于基于语义相似性和时间窗口对所述融合后特征序列在线构建图结构,其中,通过残差式建模长时序与跨说话人依赖,得到增强后特征序列; 所述语义-时序图增强模块被配置为执行如下操作: 基于特征相似度在全序列中选取k个最近邻作为语义边;在预设时间窗口内添加时序边;将语义边与时序边合并为图邻接结构,并基于多头图注意力进行特征传播;将图增强后的特征按时间索引还原并以残差形式回注到原序列,得到增强后特征序列; 自适应对比对齐模块,用于在训练过程中对所述多模态特征进行投影和L2归一化,计算模态对之间的对比损失,并通过动态调度对比损失的温度和权重,自适应对比对齐训练过程; 分类模块,用于基于所述增强后特征序列输出话语级情感标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆市信息通信咨询设计院有限公司,其通讯地址为:400050 重庆市九龙坡区歇台子科园四路257号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励