一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备

导航：龙图腾网> 最新专利技术> 一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学

摘要：一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备，它属于机器的多模态感知技术领域。本发明解决了现有情感分析技术需要人工对各模态序列进行对齐标注的问题。本发明对现有大规模预训练语言模型的多模态情感分析方法进行改进，使本发明方法不需要人工的对齐标注，因而适合目前大规模数据量、未对齐的多模态序列场景的情形，极大地提高了其实用性。而且，将本发明提出的方法在公开的最常使用的多模态情感分析的2个数据集上进行验证，结果表明其分类性能较基线系统有很大提高。本发明可以应用于情感分析。

主权项：1.一种基于跨模态自动对齐和预训练语言模型的情感分析方法，其特征在于，所述方法具体包括以下步骤：步骤1、提取输入视频中的音频模态情感特征；利用表示第i帧音频的情感特征，将提取的各帧音频的情感特征表示为音频情感特征序列Ta代表音频序列长度，代表实数域；提取输入视频中的视觉模态情感特征；利用表示第j帧图像的情感特征，将提取的各帧图像的情感特征表示为视觉情感特征序列Tv为图像帧数；步骤2、采用预训练好的BERT模型提取输入视频的词向量序列，将提取出的词向量序列和音频情感特征序列、视觉情感特征序列进行自动对齐；所述步骤2的具体过程为：将预训练好的BERT模型的第一层输出作为输入视频的词向量序列其中，wk代表序列中的第k个词向量，Tl代表词向量序列的长度；将音频情感特征序列映射到词向量序列所在的语义空间，得到映射后的特征序列其中，fa·为音频情感特征序列对应的映射函数，为对应的映射后情感特征；分别计算词向量wk与各帧音频对应的映射后情感特征的语义相似度，再对计算出的语义相似度进行归一化处理，将获得的归一化处理结果作为对应帧音频情感特征的权重；根据权重对提取的各帧音频的情感特征进行加权求和，得到与词向量wk对应的音频情感特征其中，代表第1帧音频的情感特征的权重；进而得到与词向量序列对齐的音频情感特征序列将视觉情感特征序列映射到词向量序列所在的语义空间，得到映射后的特征序列其中，fv·为特征序列对应的映射函数，为对应的映射后情感特征；分别计算词向量wk与各帧图像对应的映射后情感特征的语义相似度，再对计算出的语义相似度进行归一化处理，将获得的归一化处理结果作为对应帧图像情感特征的权重；根据权重对提取的各帧图像的情感特征进行加权求和，得到与词向量wk对应的视觉情感特征其中，代表第1帧图像的情感特征的权重；进而得到与词向量序列对齐的视觉情感特征序列将作为词向量序列和音频情感特征序列、视觉情感特征序列自动对齐的结果；步骤3、对词向量序列进行修正利用自适应门函数和步骤2的自动对齐结果对词向量序列进行修正，获得修正后的词向量序列；步骤4、情感预测将修正后的词向量序列作为预训练好的BERT模型的第二层的输入，修正后的词向量序列依次经过预训练好的BERT模型的后续结构，得到输入视频的情感倾向。

全文数据：

权利要求：

百度查询：哈尔滨工业大学一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于汽车变速箱悬架的压铸模具

下一篇：一种电子水泵噪声振动测试台架装置及噪声测试方法

相关技术

一种用于汽车变速箱悬架的压铸模具

一种电子水泵噪声振动测试台架装置及噪声测试方法

连接器和电子设备

用于烯烃生产的配置

一种可对球阀均匀喷漆的球阀喷漆装置及喷漆工艺

应用的运行方法及装置、电子设备、存储介质

一种用于肺癌新辅助免疫治疗及化疗的预后标志物及其应用

用于使用子图片对特征进行视频编码的系统和方法

重油加氢装置平稳运行控制参数的确定方法及装置

接地开关

可冲散无纺布制备新工艺及应用

螺纹钢及其轧制方法、螺纹钢钢液的制备方法

情感相关技术

基于情感分析的短视频获赞数量预测方法_北京工业大学_202210317169.4

基于图卷积网络的文本情感分析方法、系统和电子装置_北京大学深圳研究生院_202010856600.3

情感可控脸部动画生成方法、装置、设备及介质_北京交通大学_202410817860.8

一种用于多领域的文本情感分类方法_无锡学院_202310815104.7

基于眼球信息的建筑要素的情感确定方法及相关设备_河北工程大学_202410752174.7

基于建筑要素的情感确定模型的训练方法及相关设备_河北工程大学_202410752176.6

一种基于双分支图卷积网络的细粒度情感分析方法_上海师范大学_202410087956.3

一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备_哈尔滨工业大学_202111012714.0

一种基于双模态信息增强多头注意力的视频情感分析方法_上海大学_202110195691.5

一种基于文本情感与图像内容感知的跨模态正负向语义分类方法_齐鲁工业大学(山东省科学院)_202411186331.9

齐和相关技术

一种具备出料推齐功能的钢结构加工用校平机_黑龙江金昊节能保温建材集团有限公司_202323539879.0

用于燃油定量和定性评估和验收的实时测量和分析的智能系统_恩索马托斯西集团有限公司_202280091380.7

过滤单元和组件及其制造和使用方法_瑞普利金公司_202380021571.0

用于协作传输和反馈的系统和方法_华为技术有限公司_202080104732.9

用于检测睡意和/或睡眠的方法和系统_皇家飞利浦有限公司_202380022162.2

自动提取通信和内容中的承诺和请求_微软技术许可有限责任公司_202410956446.5

脱盐设备和方法_徐浩兰_202280085377.4

电子水泵和车辆_广东美芝制冷设备有限公司_202310296028.3

马达和电气产品_尼得科电机(大连)有限公司_202323192683.9

搅拌设备和方法_柏兰德公司_202410796713.7

模型相关技术

模型量化策略确定及模型量化方法、装置、介质和设备_网易(杭州)网络有限公司_202410584724.9

基于大模型的图像生成方法、模型训练方法、装置及设备_北京百度网讯科技有限公司_202410961990.9

公式识别模型的训练方法、装置和用于模型训练的装置_北京搜狗科技发展有限公司_202111156277.X

一种基于业务坐标模型的业务资源模型管理方法及系统_北京侏罗纪软件股份有限公司_202410811391.9

训练生成模型的方法和装置_支付宝(杭州)信息技术有限公司_202410692380.3

模型训练、图像分类方法和装置_北京京东振世信息技术有限公司_202111271211.5

一种建筑模型展示装置_安徽荣居建筑工程有限公司_202420009513.8

物联数据模型管理系统_交控科技股份有限公司_202210157142.3

一种建筑模型构建装置_芜湖青境科技有限公司_202410723568.X

一种口腔教学模型_上海交通大学医学院附属第九人民医院_202411013638.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务