一种基于多模态数据的电影类型预测方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：苏州大学

摘要：本发明涉及一种基于多模态数据的电影类型预测方法和系统，方法包括：对每部电影的文本、视频、海报和音频数据分别进行嵌入，得到文本、视频、海报和音频嵌入；将文本嵌入和视频嵌入进行处理，得到文本和视频特征；同时对海报嵌入和音频嵌入分别进行处理，得到海报特征和音频特征；将每部电影的文本和视频特征、海报特征和音频特征进行融合，得到所有电影的多模态数据；基于电影元数据构建不同电影的多模态电影图，并对多模态电影图和所有电影的多模态数据进行学习，得到电影嵌入；根据电影嵌入对不同电影类型进行分类。本发明在电影类型分类任务中考虑多模态数据之间的交互，并加入了电影元数据，有效提高电影类型分类结果。

主权项：1.一种基于多模态数据的电影类型预测方法，其特征在于：包括：步骤S1：获取每部电影的文本、视频、海报和音频数据并对其分别进行嵌入，得到文本嵌入、视频嵌入、海报嵌入和音频嵌入；步骤S2：将所述文本嵌入和视频嵌入进行拼接，并对拼接后的数据进行特征提取与融合，得到文本和视频特征；同时对所述海报嵌入和音频嵌入分别进行特征提取，得到海报特征和音频特征；步骤S3：基于电影元数据构建不同电影的多模态电影图，并使所述文本和视频特征、海报特征和音频特征对所述多模态电影图中的电影元数据进行学习，得到电影嵌入，其中，所述电影元数据包括导演、编剧和演员信息；步骤S4：根据所述电影嵌入对不同电影类型进行分类；所述步骤S2和步骤S3之间还包括：将每部电影的文本和视频特征、海报特征和音频特征进行融合，得到所有电影的多模态数据；所述将每部电影的文本和视频特征、海报特征和音频特征进行融合，得到所有电影的多模态数据，方法包括：将每部电影的文本和视频特征OTV转换为与海报特征OP和音频特征OA相同的维度空间h，得到多模态特征F，表示为：其中，经过维度空间转换的文本和视频特征；将所述多模态特征F沿转换后的维度空间h进行连接以获得fi∈Rm×h，其中，m表示模态数目；通过第一线性矩阵Wq获得查询矩阵Qi＝fiWq，通过第二线性矩阵Wk获得关键矩阵Ki＝fiWk，通过第三线性矩阵Wv获得值矩阵Vi＝fiWv；根据所述查询矩阵Qi和关键矩阵Ki计算模态间注意矩阵Pi，公式为：其中，softmax·表示注意力函数；T表示矩阵转置，Pi∈Rm×m，R表示向量空间，Pi表示在第i部电影中三种模态互相之间的关注度；根据所述模态间注意矩阵Pi构和值矩阵Vi构建注意力聚合，表示为PiVi；将注意力聚合PiVi后的多模态特征F进行向量化，得到Oi，并对多模态特征F添加残差连接，公式为：Oi＝VecPiVi+fi，其中，Vec·表示将特征矩阵按行展开，Oi∈R1×mh；将所有电影的Oi进行聚合，表示为：O＝{O1,O2,...,ON}，其中，O表示所有电影的多模态数据；所述步骤S3的方法包括：基于电影元数据构建不同电影的多模态电影图，并获取所述多模态电影图的邻接矩阵，其中，若电影Di和电影Dj之间的电影元数据中导演、编剧或演员重叠个数超过预设阈值，则多模态电影图中电影Di和电影Dj之间存在边，对应邻接矩阵中电影Di和电影Dj的元素为1；否则多模态电影图中电影Di和电影Dj之间不存在边，对应邻接矩阵中电影Di和电影Dj的元素为0；将所述多模态电影图的邻接矩阵和所有电影的多模态数据输入至两层图神经网络，所述两层图神经网络用于通过多模态电影图的邻接矩阵来更新所有电影的多模态数据，得到电影嵌入。

全文数据：

权利要求：

百度查询：苏州大学一种基于多模态数据的电影类型预测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：逆变器动态功率解耦控制方法及装置

下一篇：一种线控转向系统动态负载模拟装置及控制方法

相关技术

逆变器动态功率解耦控制方法及装置

一种线控转向系统动态负载模拟装置及控制方法

一种能自动弹出的抽屉式车载冰箱

一种可溯源可监控的监狱针车分发装置及系统

一种基于梯度语义属性嵌入的无监督用户对齐方法

牙冠的宽度数值确定方法、装置、设备及存储介质

机载光电设备反射镜均热化控温装置

一种组装单元体用稳态调节控制系统

超临界晶圆清洗/干燥介质回收方法以及系统

一种组合式固定件依附锁定器

一种冰孔约束下水下航行体出水试验装置及试验方法

一种基于AI的纸币识别方法及纸币清分机

电影相关技术

一种基于多模态数据的电影类型预测方法和系统_苏州大学_202310440703.5

一种电影数字水印的管理方法和水印控制软件的控制方法_中央宣传部电影技术质量检测所_202211027478.4

共享新电影模式系统_家门口(北京)影院有限公司_202410617036.8

一种融合注意力机制和双端知识图谱的电影推荐方法_辽宁工程技术大学_202111682078.2

盲人无障碍电影音频处理方法、装置及存储介质_百视通网络电视技术发展有限责任公司_202211385507.4

一种面向电影推荐系统的异构网络图链接预测方法_浙江工业大学_202410659014.8

胶片电影转数字电影装置_忆备缩微科技(北京)有限公司_202011058440.4

融合大语言模型和知识图谱的电影个性化推荐方法及系统_广东技术师范大学_202411009568.X

一种新型4D特效电影_上海睿宏文化传播有限公司_202323105915.2

一种具有定位功能的电影幕布_安徽影动巨星银幕有限公司_202323505736.8

类型相关技术

用电模块及应用其的车规类型的用电系统_矽力杰半导体技术(杭州)有限公司_202410586064.8

有机质类型频繁变化页岩层段岩相精细识别与划分的方法_中国石油化工股份有限公司_202310273022.4

多类型储能系统中的电力调峰方法及系统_一能电气有限公司_202411162912.9

一种情感类型辨别及情感强度计算方法_北京语言大学_202011426092.1

诊断服务类型切换方法、装置、设备及计算机介质_东软睿驰汽车技术(沈阳)有限公司_202410693736.5

多类型目标识别模型的训练方法、装置、设备和介质_北京罗克维尔斯科技有限公司_202310258201.0

一种基于多模态数据的电影类型预测方法和系统_苏州大学_202310440703.5

一种考虑暂降类型的敏感设备故障概率评估方法_国网湖北省电力有限公司电力科学研究院_202111522179.3

用于长期演进机器类型通信中的资源预留的方法和装置_华为技术有限公司_202080072090.9

一种打火类型识别电路及识别方法、电子设备_中国工程物理研究院应用电子学研究所_202410993983.7

预测相关技术

交通流预测方法和交通流预测系统_山东高速基础设施建设有限公司_202410813731.1

水库水位预测方法_浙江华东测绘与工程安全技术有限公司_202411155696.5

SOC预测系统_日立安斯泰莫株式会社_202280091398.7

情境化故障预测系统_联想(北京)有限公司_202310250601.7

光学呼吸速率预测系统_美国亚德诺半导体公司_202410310874.0

一种石灰石供浆管道堵塞状况预测方法及预测装置_国能龙源环保有限公司_202111339371.9

基于大数据的产品需求信息预测方法、装置、预测平台及介质_暨南大学_202410842824.7

清醒度预测方法、清醒度预测装置以及控制对象设备_松下电器(美国)知识产权公司_202110453812.1

燃气自保护兼负荷预测系统_涿州滨海燃气有限公司_202322960939.X

车辆的能耗预测方法及装置_中国第一汽车股份有限公司_202410732485.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于多模态数据的电影类型预测方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务