买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于低秩因子分解的多模态特征学习效率优化方法,涉及多模态特征学习效率优化技术领域。本发明包括以下步骤:接收获取多种类型的输入数据,将采集到的输入数据分为三种不同的模态;建立骨干网络采用分层知识集成的方法对多模态语义进行关联学习。本发明采用基于多模态特征语义的知识集成法对多模态数据进行关联学习。采用自注意力知识库和多个知识模块集成的方式进行知识对齐。共享的自注意力模块可以有效学习不同模态的知识对齐,并对不同模态信息深度融合编码,使其能够更好地应用在多模态行为识别任务上,提高多模态特征的学习效率。
主权项:1.一种基于低秩因子分解的多模态特征学习效率优化方法,其特征在于,包括以下步骤:Step1:接收获取多种类型的输入数据,将采集到的输入数据分为三种不同的模态;Step2:建立骨干网络采用分层知识集成的方法对多模态语义进行关联学习;Step3:采用近似张量融合方法来构建所有单个模态、双模态以及三模态之间的交互关系,减少独立骨干网络的使用数量来得到多模态知识表示;Step4:获取得到的模态并根据模态的类型采用对应的算法生成对应模态数据的上下文向量;Step5:设置一个低秩因子分解模块,对得到的上下文向量进行分解,分解后的上下文向量融合成多模态融合表达式;Step6:多模态融合表达式经过一个1D的时间卷积层,得到模态融合序列的局部信息;Step7:采用融合跨模态信息的Transformer操作,基于跨模注意力模块,使一个模态从另外一个模态接收信息;三种不同模态分别被划分为文本、音频、视频,特征语义知识集成包括多模态向量结点、多模态语义结点、知识库结点、多模态知识节点、语义知识间的集成关系以及实时待测数据结点;骨干网络是由一个自注意力知识库、一个自注意力模块和多个模态的语义模块组成的MultiwayTransformer,且自注意力知识库中包含视觉知识、语音知识和文本知识;Step2中建立骨干网络采用分层知识集成的方法对多模态语义进行关联学习的步骤为:Step2.1.1:将从自注意力模块和模态的语义模块得到的信息都将送入一个前馈神经网络;Step2.1.2:使用自注意力模块对来自不同模态的信息进行知识对齐,并对不同模态信息深度融合编码,使其能够提升模型在多模态视觉理解任务上的性能;Step2.1.3:根据当前输入的模态类别,MultiwayTransformer会选择不同的知识模块对其进行编码,以提取丰富的模态特定信息;Step4中获取得到的模态并根据模态的类型采用对应的算法生成对应模态数据的上下文向量的步骤为:Step4.1:输入的视频序列将经过动态粒子数据增强方法进行数据增强,即得到含有上下文信息的视觉上下文向量;Step4.2:音频序列经过一步LSTM数据压缩进行数据增强,即得到音频上下文向量;Step4.3:文本序列通过标准的BERT语言处理模型,即得到文本上下文向量。
全文数据:
权利要求:
百度查询: 东北电力大学 一种基于低秩因子分解的多模态特征学习效率优化方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。