Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖南工商大学佘亮获国家专利权

湖南工商大学佘亮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖南工商大学申请的专利一种基于协作学习与IoST数据的场景图生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120374960B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510839242.8,技术领域涉及:G06V10/25;该发明授权一种基于协作学习与IoST数据的场景图生成方法是由佘亮;金泽晖;李姣燕设计研发完成,并于2025-06-23向国家知识产权局提交的专利申请。

一种基于协作学习与IoST数据的场景图生成方法在说明书摘要公布了:本申请涉及一种基于协作学习与IoST数据的场景图生成方法,该方法通过对IoST场景下的图片进行目标检测,得到图片中主语目标宾语目标的视觉特征;对于主语目标的视觉特征,计算出主语目标与宾语目标之间的差异引导提示向量;将添加位置编码得到的初始视觉块特征、差异引导提示向量经过多层第一Transformer,基于各层中的注意力机制将每层输入的任意一种视觉块特征与对应差异引导提示向量进行融合,而最后一层输出若干个主语视觉特征块;对宾语目标的视觉特征进行相同处理,得到若干个宾语视觉特征块;基于各主语视觉特征块与各宾语视觉特征块得到关系分类结果;最后,基于关系分类结果、主语目标、宾语目标构建出场景图。

本发明授权一种基于协作学习与IoST数据的场景图生成方法在权利要求书中公布了:1.一种基于协作学习与IoST数据的场景图生成方法,其特征在于,包括: S1:获取IoST场景下待处理的图片,利用目标检测器对图片进行目标检测,得到图片中各目标的类别、边界框以及视觉特征,目标包括主语目标宾语目标; S2:为主语目标的视觉特征添加位置编码,得到初始视觉块特征;计算出主语目标与宾语目标之间类别、边界框的差异,得到差异引导提示向量;将初始视觉块特征经过多层第一Transformer,从第二层开始每层第一Transformer的输入均为上一层输出的视觉块特征;基于各层第一Transformer中的S²P_MSA机制将每层输入的初始视觉块特征视觉块特征与差异引导提示向量进行融合,最后一层第一Transformer输出若干个主语视觉特征块; 得到差异引导提示向量的过程包括: 基于主语目标与宾语目标之间类别的语义向量差异,得到主宾语义差异特征; 将两边界框之间各横坐标的相对位置差异、各纵坐标的相对位置差异、相对尺寸差异以及交集区域与主语目标的边界框的比例差异一并输入至全连接层,映射为主宾空间差异特征; 将主宾语义差异特征与主宾空间差异特征拼接后经过ReLU激活函数,并将所得的激活结果经过Dropout函数进行正则化,得到空间提示向量; 将归一化的空间提示向量与任意一个归一化的初始视觉块特征视觉块特征相乘,得到掩码向量,将掩码向量与初始视觉块特征视觉块特征进行矩阵元素乘积运算,得到对应的空间提示后的视觉块特征; 将主宾空间差异特征经过全连接层进行映射,得到通道提示向量; 将对应的空间提示后的视觉块特征与通道提示向量相乘,并将所得的乘积经过多层感知机,得到初始视觉块特征视觉块特征对应的差异引导提示向量; S3:将步骤S2中的主语目标的视觉特征替换为宾语目标的视觉特征,再次执行步骤S2,得到若干个宾语视觉特征块; S4:将各主语视觉特征块与各宾语视觉特征块沿通道方向连接后分别经过全连接层,得到若干个主宾语义视觉特征;将主宾语义视觉特征经过关系解码器,并将解码结果映射为关系分类结果,基于关系分类结果、主语目标、宾语目标构建场景图。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南工商大学,其通讯地址为:410205 湖南省长沙市岳麓区岳麓大道569号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。