一种面向视觉场景图生成的多分支混合注意力模型

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种面向视觉场景图生成的多分支混合注意力模型，首先对输入图像通过基础特征提取网络提取出特征图以及检测出图中所包含的目标；将提取出的特征划分为视觉、语义、和位置特征；上述特征输入到目标上下文传递模块进行上下文信息传递以及边上下文信息传递，得到每个目标对应的综合特征向量；得到综合向量后将所有综合向量按照目标对进行组合，同时将原始的各模态向量也按照目标对关系组合；将各目标对的特征输入至多分支混合注意力模块中提取关系对的综合特征并进行谓词分类，得到最终目标关系谓词预测结果。本发明设计了多分支混合注意模块与混合区域预处理结构，能够有效提升视觉场景图的生成准确度。

主权项：1.一种面向视觉场景图生成的多分支混合注意力模型，其特征在于，它包括以下步骤：步骤1：模型输入为原始的RGB图像，首先将图像输入至特征提取即目标检测模块中检测图像中所有目标并输出其对应的特征，所述特征包括视觉特征、位置特征以及语义特征；步骤2：目标上下文信息传递以及边上下文信息传递，沿用了基于消息传递机制的模型结构，将步骤1中输出的各目标视觉、语义以及位置特征拼接后，采用LSTM结构作为信息的提取模型对特征进行信息传递计算后得到目标的综合特征，再将综合特征与目标类别输入至边上下文传递模块，最终输出每个目标的边特征向量；步骤3：将步骤1的所有目标中任意两个目标i,j的特征按照目标关系对在模态内进行两两组合得到关系对的视觉、语义、位置特征，同时将步骤2输出的综合特征向量按照目标关系对进行组合得到关系对的综合特征，共同输入至多分支混合注意力模块中；步骤4：在多分支混合注意力模块中，首先分别对输入特征进行单独自注意力特征提取，而后通过三个交叉注意力模块分别计算视觉特征、语义特征、位置特征与综合特征的关联程度，最后将各模态特征进行加权融合，输出最终特征向量，过程可用以下公式表述：三条分支的预处理阶段：各分支的混合注意力计算：分支特征合并阶段：上式中，HA·表示混合注意力模块，由自注意力单元SA·和交叉注意力单元CA·组成；FC·表示全连接映射层，cat·表示特征拼接操作，Vi,Li,Pi表示各模态的视觉、语义、位置特征；步骤5：关系对视觉区域预处理，在引入关系对的视觉区域时使用混合注意力块来提取其中的重点特征，通过混合注意力块中的自注意力单元和交叉注意力单元来增强主宾目标的特征占比；交叉注意力单元的输入分为两部分，第一部分是主宾目标的类别特征和位置特征，第二部分是关系对的视觉区域特征，将输出特征与多分支混合注意力模块输出叠加得到最终特征向量；步骤6：使用分类层对步骤5中得到的特征向量进行预测分类，输出每组关系对的关系谓词预测结果。

全文数据：

权利要求：

百度查询：西北机电工程研究所一种面向视觉场景图生成的多分支混合注意力模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种眼科手术用超声乳化设备

下一篇：一种建筑造价测绘装置

相关技术

一种眼科手术用超声乳化设备

一种建筑造价测绘装置

断路器系统

一种立式多轴多工位针阀体中孔座面大端面磨床

一种宠物兽医用雾化治疗箱

一种可靠性高的多芯高储能薄膜电容器

一种旋翼式无人机的扭矩测试装置及测试方法

大型集装箱船艉轴辅助安装装置

一种PE管生产韧性检测设备

一种酸碱储槽的酸雾吸收装置

一种降解包装材料的流延加工设备

一种钢筋布设间距检测装置

生成相关技术

气溶胶生成系统和气溶胶生成制品_韩国烟草人参公社_202380032715.2

气溶胶生成装置及气溶胶生成系统_沃德韦国际控股有限公司_202310565460.8

气溶胶生成装置_思摩尔国际控股有限公司_202420204001.7

液滴生成系统_逐因生物科技(重庆)有限公司_202411117773.8

内窥镜图像生成方法_新加坡国立大学_202310553139.8

基于语义编辑和生成对抗网络的PCB瑕疵图像生成方法_北京信息科技大学_202310572842.3

一种气溶胶生成制品及气溶胶生成系统_深圳市合元科技有限公司_202420074209.1

基于深度卷积生成对抗网络的地质模型快速生成方法_中国地质大学(武汉)_202111390972.2

无人船控制策略的生成模型构建及生成方法及电子设备_浙江省交通运输科学研究院_202411049958.X

基于检索增强生成技术与生成式大模型的自主代理系统_浙江大学计算机创新技术研究院_202411076898.0

分支相关技术

一种配电分支箱_国网江苏省电力有限公司高邮市供电分公司_202411200860.X

一种具有电缆夹的电缆分支箱_众路电气集团有限公司_202323524035.9

一种管母线的分支连接结构_扬州通华电气有限公司_202420766428.6

一种电缆分支箱的接地装置_山东晟运恒电气有限公司_202411252788.5

一种特种车辆底盘分支线束_安徽九纬科技有限公司_202420771786.6

一种低压电缆分支箱_河南瑞尔电气股份有限公司_202420938730.5

一种高压电缆分支箱的电缆分布卡紧装置_江苏扬子电力科技有限公司_202410779032.X

一种基于分支定价算法的多信息采集机器人避险方法_东南大学_202411005431.7

一种面向视觉场景图生成的多分支混合注意力模型_西北机电工程研究所_202411066922.2

用于血管内图像与血管外图像共配准的侧分支检测_波士顿科学国际有限公司_202410617874.5

图相关技术

调用链路图更新的方法_中移互联网有限公司_202411075316.7

一种设计用图辅助装置_邹霓_202421010801.1

特征图缓存装置、方法、设备及存储介质_爱芯元智半导体股份有限公司_202411287574.1

一种图搜索方法、装置及设备_支付宝(杭州)信息技术有限公司_202111317516.5

图数据库的管理方法和装置_杭州悦数科技有限公司_202210434796.6

用于配准户型图的方法和装置_贝壳找房(北京)科技有限公司_202111566959.8

用于NR的LDPC基础图的使用_上海诺基亚贝尔股份有限公司_202411201388.1

一种时空图信号降噪重构方法_中国矿业大学_202410074355.9

鸟瞰图处理方法、装置及电子设备_北京鸿合爱学教育科技有限公司_202111210123.4

气象灾害的时序图生成方法、装置及电子设备_中国气象局公共气象服务中心(国家预警信息发布中心)_202410437220.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向视觉场景图生成的多分支混合注意力模型

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务