北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司张树获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司申请的专利一种基于多模态图像融合的目标检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114694001B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210137919.X,技术领域涉及:G06V10/80;该发明授权一种基于多模态图像融合的目标检测方法及装置是由张树;马杰超;俞益洲;李一鸣;乔昕设计研发完成,并于2022-02-15向国家知识产权局提交的专利申请。
本一种基于多模态图像融合的目标检测方法及装置在说明书摘要公布了:本发明提供一种基于多模态图像融合的目标检测方法及装置。所述方法包括:实时获取视频图像和红外图像,并分别输入至由Transformer构成的目标检测模型;对所述视频图像和红外图像分别进行全局特征提取;对提取的视频图像特征和红外图像特征进行融合;将视频图像和红外图像的融合特征输入由Transformer全连接层构成的预测模块,输出目标类别和目标位置。本发明利用纯Transformer构建目标检测模型,可充分发挥Transformer整体结构带来的模型优势;本发明基于视频图像和红外图像的特征融合进行目标检测,可以实现任何光照条件下的目标检测,解决了现有检测系统在夜晚等黑暗环境下检测效果差的问题。
本发明授权一种基于多模态图像融合的目标检测方法及装置在权利要求书中公布了:1.一种基于多模态图像融合的目标检测方法,其特征在于,包括以下步骤: 实时获取分别由视频摄像头和红外摄像头拍摄的视频图像和红外图像,并分别输入至由Transformer构成的目标检测模型; 利用由Transformer编码器构成的特征编码模块对所述视频图像和红外图像分别进行全局特征提取; 利用由Transformer解码器构成的特征融合模块对提取的视频图像特征和红外图像特征进行融合; 将视频图像和红外图像的融合特征输入由Transformer全连接层构成的预测模块,输出目标类别和目标位置; 所述特征融合模块由Transformer解码器堆叠而成,每个Transformer解码器包括一个多头自注意力模块层、一个多头互注意力模块层和一个前馈网络层以及与每层相连的一个规范化层及残差单元;为第一层Transformer解码器单独初始化定义的查询向量作为输入,所述查询向量为一组可学习的参数,可隐式地学习提取多模态图像中存在目标的区域的位置编码,第i个Transformer解码器的多头互注意力模块层的询问向量Qi来自多头自注意力模块层的输出,键向量Ki和值向量Vi分别来自特征编码模块输出的视频图像特征A和红外图像特征B;第i+1个Transformer解码器的多头互注意力模块层的询问向量Qi+1来自多头自注意力模块层的输出,键向量Ki+1和值向量Vi+1分别来自B和A;键向量Ki和值向量Vi均为N×d'矩阵,询问向量Qi为N'×d'矩阵,N'N;i=1,2,…N'-1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京深睿博联科技有限责任公司;杭州深睿博联科技有限公司,其通讯地址为:100080 北京市海淀区海淀大街8号A座21层A区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。