买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东工业大学
摘要:本发明公开了一种基于小样本元强化学习的北斗卫星定位方法及系统,该方法包括:获取北斗卫星的原始测量数据,并利用基于模型的方法进行处理,得到初始粗略定位结果;根据所述原始测量数据和所述初始粗略定位结果,得到车辆历史位置序列和卫星特征向量;基于所述车辆历史位置序列和所述卫星特征向量构建强化学习环境的多输入观测空间;搭建基于强化学习的位置校正基础模型,利用所述多输入观测空间,得到校正动作生成校正后的位置。该系统包括:数据获取模块、环境构建模块、模型构建模块和定位校正模块。通过使用本发明,能够在较低样本量的情况下实现精确的定位。本发明可广泛应用于定位导航领域。
主权项:1.一种基于小样本元强化学习的北斗卫星定位方法,其特征在于,包括以下步骤:获取北斗卫星的原始测量数据,并利用基于模型的方法进行处理,得到初始粗略定位结果;根据所述原始测量数据和所述初始粗略定位结果,进行位置提取和特征提取,得到车辆历史位置序列和卫星特征向量;基于所述车辆历史位置序列和所述卫星特征向量构建强化学习环境的多输入观测空间;搭建基于强化学习的位置校正基础模型,利用所述多输入观测空间,得到校正动作;根据所述初始粗略定位结果和所述校正动作生成校正后的位置;还包括:基于元学习的方法训练所述基于强化学习的位置校正基础模型;所述元学习的方法包括基于一阶梯度元学习算法的泛化训练和基于注意力机制的一阶梯度元学习算法的微调训练;所述基于元学习的方法训练所述基于强化学习的位置校正基础模型这一步骤,其具体包括:泛化阶段:构建泛化阶段学习任务,设置泛化阶段的超参数并通过一阶元学习训练方法进行训练,输出泛化阶段的训练结果;微调阶段:构建微调阶段学习任务,设置微调阶段的超参数,基于所述泛化阶段的训练结果和微调阶段学习任务进行训练,通过注意力机制学习不同域之间的相关性,计算相似度得分;根据所述相似度得分更新所述基于强化学习的位置校正基础模型的初始参数;微调阶段的初始参数更新的计算公式表示如下: 式中表示从小样本训练集中构建出用于微调的训练任务,即表示不同任务下的相似度得分,表示完成任务后得到的训练好的分模型策略参数,表示最大的迭代轮次。
全文数据:
权利要求:
百度查询: 广东工业大学 一种基于小样本元强化学习的北斗卫星定位方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。