买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请属于无人机集群控制技术领域。本申请提供一种基于强化学习的无人机集群协同对抗决策方法。本公开实施例根据己方无人机集群和对手无人机群的对抗场景,提出无人机运动模型和几何态势模型;基于无人机运动模型和无人机之间的几何态势模型,设计无人机生存状态更新规则和对抗任务;将多无人机作战表示为连续空间中的马尔可夫博弈,采用MAPPO算法进行策略迭代优化,设计有效的稀疏奖励函数来指导无人机进行对抗博弈,实现了智能体的学习和集群整体协同对抗的统一,提高了无人机的响应速度,解决了复杂态势环境中奖励函数设计复杂、决策时效性有限等挑战。
主权项:1.一种基于强化学习的无人机集群协同对抗决策方法,其特征在于,该方法包括:基于任务无人机群和对手无人机群的对抗场景,建立无人机运动模型和几何态势模型;基于无人机运动模型和几何态势模型,设定对抗任务规划;根据任务无人机群针对对抗任务规划作出的任务决策,将马尔可夫决策问题建模为马尔可夫博弈;基于马尔可夫博弈,建立基于MAPPO的强化学习模型,并对强化学习模型进行训练;利用训练后的强化学习模型获取协同控制策略。
全文数据:
权利要求:
百度查询: 西北工业大学 基于强化学习的无人机集群协同对抗决策方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。