Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国矿业大学王浩宇获国家专利权

恭喜中国矿业大学王浩宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国矿业大学申请的专利一种基于场景语言感知引导的多模态无人机目标检测框架获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119360243B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411395067.X,技术领域涉及:G06V20/17;该发明授权一种基于场景语言感知引导的多模态无人机目标检测框架是由王浩宇;刘晓敏;张威;王兆杰;王雪松;程玉虎;乔振壮;殷豪杰;曲世元设计研发完成,并于2024-10-08向国家知识产权局提交的专利申请。

一种基于场景语言感知引导的多模态无人机目标检测框架在说明书摘要公布了:本发明属于计算机视觉技术领域,公开了一种基于场景语言感知引导的多模态无人机目标检测框架。首先,将视觉‑语言预训练模型嵌入多模态目标检测框架中,提出了场景语言感知模块,利用视觉‑语言预训练模型为模型提供场景智能感知和理解能力。其次,通过条件参数生成模块根据当前场景和目标特征动态生成融合参数,通过为不同目标定制个性化的融合模式提升模型对场景变化的适应能力。最后,设计了多模态动态解码器,建立了动态对称融合机制,通过动态挖掘多模态数据间的复杂互补关联实现多模态特征融合,并根据当前场景实时调整不同模态的重要性,将DETR的解码机制从单模态扩展到多模态,为多模态无人机目标检测提供了无需先验框的新范式。

本发明授权一种基于场景语言感知引导的多模态无人机目标检测框架在权利要求书中公布了:1.一种多模态目标检测方法,其特征在于,包括如下步骤:步骤1,将红外和可见光图像分别输入到骨干网络得到多模态特征图,对所述多模态特征图的各元素注入位置编码,获得可见光特征序列和红外特征序列同时,将红外和可见光图像分别输入到场景语言感知模块,获得两个模态的场景语言感知嵌入和步骤2,将所述可见光特征序列和红外特征序列输入到Transformer编码器中,捕获特征序列中各元素间的空间依赖关系,得到两个模态的特征增强序列和将两个模态的特征增强序列和输入分类器,得到两个模态的分类图CV和CI;步骤3,基于两个模态的分类图CV和CI,选择分类概率得分前topN的元素,构建两个模态的查询序列EV和EI;步骤4,对两个模态的查询序列EV和EI进行特征增强,得到更新后的两模态的查询序列和将两模态的查询序列和与场景语言感知嵌入和一起输入到条件参数生成模块,为查询序列中的每个元素定制个性化的融合参数W;步骤5,基于所述融合参数W,对查询序列和进行融合,得到融合查询序列EF;步骤6,将所述融合查询序列EF输入预测头,获得目标的位置预测和类别预测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国矿业大学,其通讯地址为:221116 江苏省徐州市铜山区大学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。