一种基于CEL-MADDPG的多无人机围捕策略方法

导航：龙图腾网> 最新专利技术> 一种基于CEL-MADDPG的多无人机围捕策略方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明提供了一种基于CEL‑MADDPG的多无人机围捕策略方法，建立一种基于多智能体深度确定性策略梯度算法的框架，将多无人机围捕任务拆分为目标追踪、包围过渡、靠近捕获三个子任务，通过设立三种奖励函数帮助多无人机对围捕过程中的各子任务进行学习，通过引入相关性指标对样本采样效率进行改进，最终，提出的基于课程经验学习的多无人机围捕策略方法能够帮助无人机在动态复杂环境下，成功追踪接近目标，并实现对目标的包围捕获。本发明能够实现无人机自主决策，且各无人机产生的行为策略协同性更强，能够使多无人机学习到更为合理的围捕策略，提升多无人机围捕模型训练效率，且构建的多无人机决策模型具有更好的围捕性能。

主权项：1.一种基于CEL-MADDPG的多无人机围捕策略方法，其特征在于包括下述步骤：步骤1：设定无人机状态信息：步骤2：设定无人机的动作信息和无人机的状态更新过程：通过直接控制无人机的受力，实现对无人机的运动姿态和飞行速度控制；因此，设定无人机动作状态信息为：A＝[Fx,Fy]其中，Fx,Fy分别表示无人机在x、y轴上的受力，则无人机的加速度表示为：a＝[ax,ay]＝[Fx,Fy]mu其中，ax,ay分别表示无人机在x、y轴上的加速度，mu表示无人机质量；基于无人机受力的无人机状态更新过程表示为：其中，其中上标t表示时间，pt，vt，分别表示t时刻我方无人机的位置信息、速度信息和偏航角，xt-1,yt-1分别表示t-1时刻我方无人机在x、y轴上的位置，分别表示t时刻我方无人机在x、y轴上的速度分量，分别表示t-1时刻我方无人机在x、y轴上的速度分量，△t表示无人机运动时间间隔，a为无人机加速度，分别表示t时刻无人机加速度在x、y轴上的加速度分量；步骤3：定义奖励函数R：步骤4：结合课程学习策略，优化无人机奖励函数：在围捕课程学习中，引入课程奖励rcourse用于引导无人机对目标追踪子任务、包围过渡子任务、靠近捕获子任务进行学习；步骤4-1：设定目标追踪子任务判定条件为：其中，dcapture表示单机捕获距离，dlimit表示针对目标追踪子任务到包围过渡子任务转化设定的阈值，当满足该条件时，课程奖励rcourse等于目标追踪子奖励rtrack，此时设定目标追踪子奖励为：其中，dmax为任务场景中目标与无人机的最大距离值；步骤4-2：设定包围过渡子任务判定条件为：其中，表示无人机i、无人机i+1、目标E构成的三角形面积，U0和Un都用于表示最后一个即第n个无人机，当满足该条件时，课程奖励rcourse等于包围过渡子奖励rencicle，此时设定包围过渡子奖励为：步骤4-3：设定靠近捕获子任务判定条件为：当满足该条件时，课程奖励rcourse等于靠近捕获子奖励rcapture，此时设定靠近捕获子奖励为：其中，和分别表示t时刻和t-1时刻无人机i到目标的距离；步骤4-4：对于每个无人机，更新其受到的总奖励为：其中，β1～β4表示四项奖励的相应权重值；步骤4-5：设定多无人机围捕判定条件：当目标处于多无人机围捕网内，且目标与各围捕无人机距离都小于捕获距离dcapture时，视作目标无法逃逸，此时多无人机围捕任务完成；步骤5：引入相关性学习策略，基于深度强化学习CEL-MADDPG算法，构建多无人机围捕决策模型并进行训练，通过CEL-MADDPG神经网络进行拟合，输出无人机飞行动作，各个围捕无人机通过协同决策，实现对目标的靠近、包围、捕获。

全文数据：

权利要求：

百度查询：西北工业大学一种基于CEL-MADDPG的多无人机围捕策略方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于使用子图片对特征进行视频编码的系统和方法

下一篇：一种基于自适应特征选择的单样本部件分割方法

相关技术

用于使用子图片对特征进行视频编码的系统和方法

一种基于自适应特征选择的单样本部件分割方法

基于大数据的深度神经网络构建音频数据搜索方法及系统

一种正负可调叠加高频脉冲的电源

一种用于汽车变速箱悬架的压铸模具

折边装置、折边系统及折边方法

一种电子水泵噪声振动测试台架装置及噪声测试方法

用于烯烃生产的配置

测试方法、装置、电子设备及可读存储介质及产品

线条体固定部件、线条体增设用固定部件以及线条体安装方法

一种潮气量检测系统及装置

一种数据加载方法、装置、电子设备及存储介质

策略相关技术

小区干扰协作策略的控制方法和装置_苏州华兴源创科技股份有限公司_202411111840.5

一种非线性对抗策略优化方法_烟台中飞海装科技有限公司_202410813159.9

一种使用对抗学习和数据选择策略的域适应方法_北京建筑大学_202410737969.0

无线专网调制编码策略配置方法、系统、设备及存储介质_中国电力科学研究院有限公司_202411158774.7

基于混合策略的暴力行为检测方法及系统、存储介质_艾伯资讯(深圳)有限公司_202010685116.9

基于深度确定性策略梯度的联邦学习分类模型训练方法_西安电子科技大学_202210712697.X

一种基于近端策略优化算法的实时最优潮流计算方法_东北大学秦皇岛分校_202210196338.3

一种基于难度引导可变攻击策略的对抗防御方法_电子科技大学_202310831043.3

模型量化策略确定及模型量化方法、装置、介质和设备_网易(杭州)网络有限公司_202410584724.9

一种利用回馈电流的均衡策略_北京宏瑞汽车科技股份有限公司_202310280145.0

无人机相关技术

一种无人机及无人机机臂快拆结构_广东普瑞智航科技发展有限公司_202411126743.3

无人机搜救方法、装置、无人机及存储介质_星展测控科技股份有限公司_202410741554.0

基于无人机定位预测方法、装置和无人机_北京邮电大学_202210073980.2

一种无人机复位装置及无人机基站_广州中科云图智能科技有限公司_202323610125.X

一种无人机路径自检方法、系统及无人机_益乘(天津)管理咨询有限公司_202410909369.8

一种无人机巡检系统与无人机巡检方法_中电(沈阳)能源投资有限公司_202410823519.3

一种水上无人机_山东福莱特无人机制造有限公司_202323057105.4

多机位无人机库_南华大学_202420298172.0

一种测绘无人机_山东省地质矿产勘查开发局第一地质大队(山东省第一地质矿产勘查院)_202323663236.7

无人机协同射流的可变进气涵道、螺旋桨及无人机_中国科学院工程热物理研究所_202411038473.0

方法相关技术

记录方法_精工爱普生株式会社_202410329157.2

分类方法_株式会社半导体能源研究所_202080059927.6

分离方法_大金工业株式会社_202380021486.4

唤醒信号的接收方法、发送方法、配置方法、装置及设备_OPPO广东移动通信有限公司_202280091619.0

原版、确定原版的图案的方法、曝光的方法、以及制造物品的方法_佳能株式会社_202410311669.6

信号传输方法、信号检测方法、装置及通信设备_维沃移动通信有限公司_202310304876.4

验证方法_上海兆芯集成电路股份有限公司_202011127602.5

接入处理方法、信息处理方法、配置发送方法及设备_维沃移动通信有限公司_202310290704.6

训练SEM图像选择方法及使用该方法的SEM设备对准方法_三星电子株式会社_202410252998.8

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于CEL-MADDPG的多无人机围捕策略方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务