买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京航空航天大学
摘要:本发明公开了一种基于协同强化学习的多无人机轨迹规划和数据收集方法,包括:建立无人机与基站间通信的信道模型和数据收集模型,提出多无人机时断时续信息共享模型,多无人机时断时续信息共享模型包括地图状态信息共享子模型和历史经验信息共享子模型;基于多智能体双深度Q网络算法,无人机在有限资源下对动态环境的信息获取不全时,将自身的观测值输入到神经网络拟合的策略函数中并根据其他无人机的协同信息交互,输出动作并获得相应的奖励,完成与环境和其他无人机的交互。本发明能够保障无人机在复杂地形或者恶意干扰隔断机间协同共享时,也能顺利完成轨迹规划和数据收集。
主权项:1.一种基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,所述多无人机轨迹规划和数据收集方法包括以下步骤:S1,建立无人机与基站间通信的信道模型,求得无人机在不同位置与基站的通信速率,进而完成数据收集;提出多无人机时断时续信息共享模型,多无人机时断时续信息共享模型包括地图状态信息共享子模型和历史经验信息共享子模型;其中,所述地图状态信息共享子模型在多无人机在信息交互未被中断时,将区域探索情况作为一部分共享信息在无人机间信息交互时共享,通过协作学习覆盖未知的感兴趣领域,减少无人机视图的重叠;所述历史经验信息共享子模型在无人机在协同未被中断时,根据无人机间的距离,计算自身的历史经验对其他无人机在t时价值的度量作为概率值,并根据概率选择是否将无人机自身的经验信息作为协同信息进行共享,使其他无人机根据共享到的信息对各自的动作选择进行调整来最优无人机系统轨迹和数据收集,并根据精确势能博弈证明了所提的协同信息交互开销、能耗与无人机轨迹规划和数据收集的均衡解;S2,基于多智能体双深度Q网络算法求解协同信息交互开销、能耗与无人机轨迹规划和数据收集的均衡解;将自身的观测值输入到神经网络拟合的策略函数中并根据其他无人机的协同信息交互,输出动作并获得相应的奖励,完成与环境和其他无人机的交互。
全文数据:
权利要求:
百度查询: 南京航空航天大学 一种基于协同强化学习的多无人机轨迹规划和数据收集方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。