哈尔滨工业大学刘冰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于动态稀疏标记的Transformer架构的RGB-D视觉显著性物体检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116206132B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310273383.9,技术领域涉及:G06V10/46;该发明授权一种基于动态稀疏标记的Transformer架构的RGB-D视觉显著性物体检测方法及系统是由刘冰;高丽娜;付平;王树炎;孙杉;周惊涛;付杰;闫铮;吴雨桐;熊伟;薛健设计研发完成,并于2023-03-21向国家知识产权局提交的专利申请。
本一种基于动态稀疏标记的Transformer架构的RGB-D视觉显著性物体检测方法及系统在说明书摘要公布了:本发明提出一种基于动态稀疏标记的Transformer架构的RGB‑D视觉显著性物体检测方法及系统。所述方法可解决简单标记RGB‑D图像引起的特征丰富度受限问题及计算效率低下的问题,并显式地提取全局上下文多模态依赖关系。此外,本发明深入研究了跨模态的差异性和一致性以集成不同阶段的多模态特征,最终生成高分辨率的显著性检测区域,进一步提升RGB‑D显著性物体检测性能。
本发明授权一种基于动态稀疏标记的Transformer架构的RGB-D视觉显著性物体检测方法及系统在权利要求书中公布了:1.一种基于动态稀疏标记的Transformer架构的RGB-D视觉显著性物体检测方法,其特征在于:所述方法包括: 步骤一、采用软分离展开操作以初始化标记序列,然后将初始化标记序列输入到层transformer以获取初始多模态全局依赖关系; 步骤二、利用动态稀疏标记编码器对不同场景自适应调整标记; 步骤三、对不同阶段获取的多模态特征标记序列进行交互式多样性融合,从而获得不同尺度的多模态特征标记序列; 步骤四、将不同阶段获取的多模态特征标记序列输入到多级集成解码器中,以逐步聚合粗尺度和细尺度的多模态特征生成显著性结果; 所述动态稀疏标记编码器的特征提取过程包括如下五个步骤: 步骤1:以RGB分支为基础,制定一个标记函数生成空间权重,并将空间权重作为掩码以稀疏标记,具体定义如下: 其中,代表稀疏标记函数,表示第个标记,用于学习外观标记中像素的信息对以生成空间权重图;代表通过三层卷积计算后使用GELU激活函数生成的逐像素空间权重,是空间的空间权重图,和分别代表空间全局池化和广播函数,代表逐像素乘法操作; 步骤2:对于深度分支,动态稀疏令牌操作过程与RGB分支相同,编码器通过添加位置嵌入的线性投影嵌入显著性标记,然后通过一系列Transformer层处理多模态标记; 步骤3:RGB分支和深度分支生成与相应模态信息最丰富的多模态标记,考虑到外观标记和深度标记的重要性不同,在编码器中设计了一个交互式多样性融合模块以获得所需的多模态标记,具体包括一个一致性融合流和一个差异融合流,其中通过融合外观标记和深度标记来获得高致信度的融合特征,定义如下: 其中,代表第阶段; 步骤4:为了增强外观信息和深度细节以获得增强的一致性多模态融合特征,具体公式可定义为: 其中,代表逐元素求和计算; 步骤5:为了进一步融合两种模态的互补特征,提出的交互式多样性融合模块的差异融合流记为,具体定义如下: 其中,代表逐元素减法;最后,通过融合后的图像块序列融合一致性融合流标记和差异融合流标记从而获得多模态交互融合后的标记。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励