首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Transformer架构的红外图像目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南开大学

摘要:本发明涉及红外图像目标检测领域,提供一种基于Transformer架构的红外图像目标检测方法,该方法包括:通过主干网络提取红外图像中的特征信息,采用逐层卷积的方式,依次获得第一特征、第二特征和第三特征;通过AIFI模块对第三特征进行尺度交互,得到第四特征,将第四特征和第一特征、第二特征分别作为三个输入特征传递到特征融合模块进行融合,获得特征融合结果;通过感知查询模块对特征融合结果进行查询,获得候选框与目标图像间的交互信息;通过解码器对交互信息进行解码,获得候选框;通过检测头对候选框进行分类和定位,获得目标检测结果。本发明实现了具有更小算法规模和更高检测精度的红外图像目标检测方法。

主权项:1.一种基于Transformer架构的红外图像目标检测方法,其特征在于,包括如下步骤:S1:通过主干网络提取红外图像中的特征信息,采用逐层卷积的方式,依次获得第一特征、第二特征和第三特征,包括:S11:对红外图像进行卷积和最大池化计算,获得第一浅层特征;S12:通过第一特征提取模块对第一浅层特征进行特征提取,获得第二浅层特征;S13:对第二浅层特征进行卷积,实现特征通道扩充,通过第二特征提取模块对通道扩充结果进行特征提取,获得第一特征,同时将第一特征保存到第一存储模块,第二特征提取模块特征提取过程为:对通道扩充结果依次进行部分卷积、升维卷积、BN层、激活函数和降维卷积处理,实现特征映射,获得第一特征;S14:对第一存储模块中的第一特征进行卷积,实现特征通道扩充,通过第三特征提取模块对通道扩充结果进行特征提取,获得第二特征,同时将第二特征保存到第二存储模块;S15:对第二存储模块中的第二特征进行卷积,实现特征通道扩充,通过第四特征提取模块对通道扩充结果进行特征提取,获得第三特征,第四特征提取模块特征提取过程为:对通道扩充结果依次进行部分卷积、升维卷积、BN层、激活函数和降维卷积处理,实现特征映射,获得第三特征;S2:通过AIFI模块对第三特征进行尺度交互,得到第四特征,将第四特征和第一特征、第二特征分别作为三个输入特征传递到特征融合模块进行融合,获得特征融合结果,过程包括:S21:对第四特征上采样,实现与第二特征统一尺寸,获得第五特征,对第五特征进行CBS处理,对处理结果和第二特征进行拼接,通过第一注意力模块对拼接结果进行特征提取,获得第一注意力特征,同时将第一注意力特征保存到第一注意力存储模块,第一注意力模块特征提取过程包括:S211:对拼接结果进行CBS处理,获得第一拼接层,同时将第一拼接层保存到第一拼接存储模块;S212:通过第一注意力子模块对第一拼接层进行融合信息提取,获得第一融合特征;S213:对第一融合特征和第一拼接存储模块中的第一拼接层进行求和,对求和结果进行CBS处理,获得第一注意力特征;S22:对第一注意力特征上采样,实现与第一特征统一尺寸,获得第六特征,对第六特征进行CBS处理,对处理结果和第一特征进行拼接,通过第二注意力模块对拼接结果进行特征提取,获得第二注意力特征,同时将第二注意力特征保存到第二注意力存储模块,第二注意力模块特征提取过程包括:S221:对拼接结果进行CBS处理,获得第二拼接层,同时将第二拼接层保存到第二拼接存储模块;S222:通过第二注意力子模块对第二拼接层进行融合信息提取,获得第二融合特征;S223:对第二融合特征和第二拼接存储模块中的第二拼接层进行求和,对求和结果进行CBS处理,获得第二注意力特征;S23:对第二注意力特征进行CBS处理,对处理结果和第一注意力存储模块中的第一注意力特征进行拼接,通过第三注意力模块对拼接结果进行特征提取,获得第三注意力特征,同时将第三注意力特征保存到第三注意力存储模块,第三注意力模块特征提取过程包括:S231:对拼接结果进行CBS处理,获得第三拼接层,同时将第三拼接层保存到第三拼接存储模块;S232:通过第三注意力子模块对第三拼接层进行融合信息提取,获得第三融合特征;S233:对第三融合特征和第三拼接存储模块中的第三拼接层进行求和,对求和结果进行CBS处理,获得第三注意力特征;S24:对第三注意力特征进行CBS处理,对处理结果和第四特征进行拼接,通过第四注意力模块对拼接结果进行特征提取,获得第四注意力特征,第四注意力模块特征提取过程包括:S241:对拼接结果进行CBS处理,获得第四拼接层,同时将第四拼接层保存到第四拼接存储模块;S242:通过第四注意力子模块对第四拼接层进行融合信息提取,获得第四融合特征;S243:对第四融合特征和第四拼接存储模块中的第四拼接层进行求和,对求和结果进行CBS处理,获得第四注意力特征;S25:对第二注意力存储模块中的第二注意力特征、第三注意力存储模块中的第三注意力特征和第四注意力特征进行拼接,获得特征融合结果;S3:通过感知查询模块对特征融合结果进行查询,获得候选框与目标图像间的交互信息;S4:通过解码器对交互信息进行解码,获得候选框;S5:通过检测头对候选框进行分类和定位,获得目标检测结果。

全文数据:

权利要求:

百度查询: 南开大学 一种基于Transformer架构的红外图像目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。