一种基于自适应MADDPG的星群规避自主决策方法

导航：龙图腾网> 最新专利技术> 一种基于自适应MADDPG的星群规避自主决策方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明公开了一种基于自适应MADDPG的星群规避自主决策方法，属于航天器任务规划技术领域，包括以下步骤：建立脉冲式星群对空间非合作目标规避任务模型；设计星群威胁规避自主决策的奖励函数；构建威胁场景预测神经网络，并进行训练；基于奖励函数，构建星群威胁规避自主决策网络；基于MADDPG算法，训练不同威胁场景下的星群威胁规避自主决策网络；将非合作目标与星群信息输入至训练后的威胁场景预测神经网络中，得到当前威胁场景，并选择对应威胁场景下训练的星群威胁规避自主决策网络，进行星群规避的自主决策。本发明解决了现有算法难以处理的由大量卫星组成的星群对非合作目标抵近威胁进行规避时产生的高复杂度的决策问题。

主权项：1.一种基于自适应MADDPG的星群规避自主决策方法，其特征在于，包括以下步骤：S1、基于T-H方程和博弈论，建立脉冲式星群对空间非合作目标规避任务模型；S2、基于脉冲式星群对空间非合作目标规避任务模型，根据非合作目标威胁与星群约束特点，设计星群威胁规避自主决策的奖励函数；S3、构建威胁场景预测神经网络，并通过非合作目标与星群信息对威胁场景预测神经网络进行训练；S4、基于奖励函数，构建星群威胁规避自主决策网络；S5、基于MADDPG算法，训练不同威胁场景下的星群威胁规避自主决策网络；S6、将非合作目标与星群信息输入至训练后的威胁场景预测神经网络中，得到当前威胁场景，并选择对应威胁场景下训练的星群威胁规避自主决策网络，进行星群规避的自主决策；所述S4中星群威胁规避自主决策网络包括Actor网络、Critic网络、Target_actor网络和Target_critic网络；所述Actor网络的输入为当前时刻的全局状态信息，输出为当前时刻的动作；所述Critic网络的输入为当前时刻的全局状态信息，输出为当前时刻的动作的评分；所述Target_actor网络的输入为下一时刻的全局状态信息，输出为下一时刻的动作；所述Target_critic网络的输入为下一时刻的全局状态信息，输出为下一时刻的动作的评分；所述Critic网络通过评分构建critic_loss函数；所述Critic网络通过critic_loss函数优化自身的网络参数；所述Actor网络通过评分构建actor_loss函数，并通过actor_loss函数计算累计期望奖励的梯度；所述Actor网络通过累计期望奖励的梯度优化自身的网络参数。

全文数据：

权利要求：

百度查询：西北工业大学一种基于自适应MADDPG的星群规避自主决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于修复叶片根部的方法

下一篇：一种平开窗

相关技术

用于修复叶片根部的方法

一种平开窗

一种轮胎X光检验机输送定位系统及工作方法

一种地表及地下浅层铀矿化的探测方法

一种光伏构件

一种塑管熔接装置

基于大模型的交互方法、装置、终端设备和存储介质

一种面向桥梁微形变监测的基于微流道技术的平面电容型微位移传感器

设备健康预测方法和计算机可读存储介质

一种基于数字密钥的电子公文管理系统及方法

一种源网荷储系统的组件配置优化方法和装置

电池、用电设备、制备电池的方法和设备

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于自适应MADDPG的星群规避自主决策方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务