买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆理工大学
摘要:本发明公开了基于解耦交叉注意力与IoU引导因子的遮挡目标检测方法,涉及计算机视觉技术领域。本发明依托自监督学习理论,提出了一种基于自监督预训练的遮挡目标检测新框架,该框架的独特之处在于采用视觉Transformer架构作为核心的特征编码器和解码器,且考虑到复杂遮挡环境下基于查询的检测器可能因遮挡物引入的噪声而降低性能,提出了解耦多头交叉注意力机制,该机制通过对采样点范围的调整,并将置信度预测与边界框预测两者解耦,有效抑制了遮挡物对置信度预测的不利影响,从而显著降低了遮挡目标检测中漏检与误检的发生概率。
主权项:1.基于解耦交叉注意力与IoU引导因子的遮挡目标检测方法,其特征在于:至少包括以下步骤:S1:搭建一个解耦交叉注意力头,用于分离置信度预测和位置预测的采样点,而无需添加任何额外参数,所述解耦交叉注意力头采用解耦多头交叉注意力机制;S2:搭建一个基于IoU引导因子策略的回归损失函数,所述IoU引导因子策略用于在训练过程中动态调整不同样本对回归损失函数的贡献,以优化模型对遮挡物体的检测性能;S3:基于解耦交叉注意力头和回归损失函数搭建一个目标检测网络,所述目标检测网络的架构采用DeformableDETR框架,所述DeformableDETR框架中至少包括特征提取模块和解码器,所述特征提取模块包括骨干网络和编码器,所述编码器为经过自监督预训练阶段的视觉Transformer编码器,所述解码器级采用解耦多头交叉注意力机制;S4:在目标检测网络框架中,图像首先被送入特征提取模块进行图像的特征提取;S5:特征提取模块融合了骨干网络和预训练的视觉Transformer编码器,目的是从输入图像中提取多尺度特征图;S6:特征图与经过初始化的query向量结合,共同输入至解码器,解码器由多个解码器块堆叠组成;S7:在解码器中,分别对目标的类别置信度和边界框位置进行预测,最终实现了对遮挡场景中目标物体的有效识别与精确定位。
全文数据:
权利要求:
百度查询: 重庆理工大学 基于解耦交叉注意力与IoU引导因子的遮挡目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。