恭喜北京航空航天大学薛瑞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京航空航天大学申请的专利一种基于视觉目标参照引导的无人机视觉语言导航方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119245649B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411334765.9,技术领域涉及:G01C21/20;该发明授权一种基于视觉目标参照引导的无人机视觉语言导航方法是由薛瑞;周亮宇;罗晓燕设计研发完成,并于2024-09-24向国家知识产权局提交的专利申请。
本一种基于视觉目标参照引导的无人机视觉语言导航方法在说明书摘要公布了:本发明提供一种基于视觉目标参照引导的无人机视觉语言导航方法,包括:利用导航任务解析模块将导航指令划分为多个子任务,并为每个子任务建立不同阶段的参照,在经过文本编码器以后通过子任务切换模块获取当前执行子任务的文本特征;通过目标定位模块中的目标检测网络识别当前时刻导航场景中的各类目标对象,并利用视觉编码器获取前视图像的视觉特征;将参照的导航文本通过目标解析模块转化为一阶逻辑程序,结合当前时刻的前视图像输入到目标定位模块实现关键目标的定位;利用视觉引导模块学习当前导航行为,并将更新后的视觉文本特征输入多模态编码器引导当前子任务各个时刻导航动作的输出,训练时引入一种自适应加权机制来最小化损失。
本发明授权一种基于视觉目标参照引导的无人机视觉语言导航方法在权利要求书中公布了:1.一种基于视觉目标参照引导的无人机视觉语言导航方法,其特征在于,包括如下步骤:S1、利用导航任务解析模块将导航指令划分为多个子任务,并为每个子任务建立不同阶段的参照,在经过文本编码器以后通过子任务切换模块获取当前执行子任务的文本特征;S2、通过目标定位模块中的目标检测网络识别当前时刻导航场景中的各类目标对象,并利用视觉编码器获取前视图像的视觉特征;S3、将参照的导航文本通过目标解析模块转化为一阶逻辑程序,结合当前时刻的前视图像输入到目标定位模块实现关键目标的定位,包括:首先在目标解析模块中将当前导航子任务对应不同阶段的参照作为输入,利用预训练的大型语言模型生成清晰明确的一阶逻辑程序;接着利用目标定位模块中的一阶逻辑执行器结合逻辑程序中的函数对步骤S2中检测到的各类视觉目标进行区分并构建对应的目标层级树,即包括:1)关键目标,导航指令中出现的和导航行为相匹配的参照物,能够指引无人机的动作输出;2)依托目标,导航指令中出现的用以辅助确定关键目标唯一性的参照物;3)其他目标,导航指令中未出现但在前视图像中被检测到的对象;对于参照中涉及导航相关的概念函数则初始化对应的多层感知器MLP,即针对导航特定领域的相关概念通过模块化的神经网络实现来判断目标是否符合对应层级的条件;最后,通过构建的层级任务树将文本模态中的关键目标与视觉模态中的对应目标表示连接起来,将无人机在导航时刻t能获取到的关键目标特征表示为;S4、利用视觉引导模块学习当前导航行为,并将更新后的视觉文本特征输入多模态编码器引导当前子任务各个时刻导航动作的输出,训练时引入一种自适应加权机制来最小化损失;所述视觉引导模块采用双流的Transformer结构对导航行为的文本tokens和视觉目标tokens进行跨模态的交互与对齐,使得生成的导航行为决策的可靠性进一步提升。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。