基于深度强化学习的无人机辅助无人艇任务卸载方法

导航：龙图腾网> 最新专利技术> 基于深度强化学习的无人机辅助无人艇任务卸载方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：东北大学秦皇岛分校

摘要：本发明涉及海洋无线通信技术领域，公开了基于深度强化学习的无人机辅助无人艇任务卸载方法，包括以下步骤：建立移动边缘计算的三维无线通信网络系统模型，所述系统模型包括K个USV，其集合表示为k∈{1,2,....,K}，k表示该集合中的某一个USV，1架搭载MEC边缘服务器的无人机U＝{u}，通过无人机对USVk进行计算卸载以节省USVk的计算的能耗并缩减任务执行延迟；建立时延模型与能耗模型；无人机调度和卸载策略联合优化问题；提出基于深度强化学习的OU‑TD3算法。本发明中，采用深度强化学习相比传统算法在无人机辅助USV进行边缘计算的任务卸载中能够更好地适应复杂、实时的任务需求，提高了系统的智能化和效率。

主权项：1.基于深度强化学习的无人机辅助无人艇任务卸载方法，其特征在于：包括以下步骤：S1、建立移动边缘计算的三维无线通信网络系统模型，所述系统模型包括K个USV，其集合表示为k∈{1,2,....,K}，k表示该集合中的某一个USV，1架搭载MEC边缘服务器的无人机U＝{u}，通过无人机对USVk进行计算卸载以节省USVk的计算的能耗并缩减任务执行延迟；设定UAV执行某次任务的周期为T，将整个通信周期T划分为N个时隙，每个时隙等长且长度为δ＝TN，第n个时隙满足集合n∈{1,2···,N}；USVk的坐标为Lkn＝[xkn,ykn,0]T，USVk的通信调度约束表示为： USVk将一部分计算任务卸载给服务器后，剩余的计算任务在本地计算；则第n个时隙末，无人机飞行到新的悬停位置表示为:Qun+1＝[xun+1,yun+1,H]T∈R3×1；无人机在第n个时隙飞行的角度为θn∈[0,2π]，θn是表示UAV在x-y平面平面相对于x轴的水平方向，飞行的速度为vn∈[0,vmax]，一个时隙内UAV的飞行时间为tflyn＝tfly，其中tfly为固定值；因此UAV的水平移动距离可以表示为：xun+1＝xun+tflyvncosθn；yun+1＝yun+tflyvnsinθn；UAV与USVk之间的视距链路的信道增益可表示为: 其中β0可以表示参考距离d＝1m处的信道增益，du,kn表示UAV与USVk之间的欧几里得距离：当UAV悬停时，UAV与USVk进行通信，则无人机的无线传输速率ru,kn表示为：其中B表示分配的通信带宽，假设所有的USVk的发射功率Pup,kn＝Pup为固定值，σ2表示噪声功率；S2、建立时延模型与能耗模型；S3、无人机调度和卸载策略联合优化问题：通过联合优化无人机的通信调度τkn，无人艇任务卸载决策Rkn、无人机飞行速度vn、无人机飞行角度θn，提出无人机与无人艇计算能耗与时延加权的最小化问题；其优化问题可以表示为： Qun∈{xun,yun|xun∈[0,X],yun∈[0,Y]}；Lkn∈{xkn,ykn|xkn∈[0,X],ykn∈[0,Y]}；Ttotal,kn≤ΔT；0≤vn≤vmax；γuav,kn≥γth；引入λe和λt分别代表系统总时延和能耗对其进行无量纲化处理，同时引入权衡因子α，对于USV在不同场景中执行的任务，无人机在一个时隙内只与一个USVk通信、任务卸载比的范围、无人机与无人艇的只能在限定的区域移动、每个时隙中系统的计算时间不能大于该任务的最大容忍延迟、C7约束表示无人机不能超过最大速度、UAV与USVk进行通信的信噪比不能低于其阈值、系统在整个周期需要处理一定的任务数据量C、任务决策期间UAV的剩余电量必须支持其飞行和计算；S4、基于深度强化学习的OU-TD3算法：1混合噪声自适应算法基于混合噪声的Actor网络输出动作at可以表示为：其中var是高斯方差，以确保Agent在每个场景中具有均匀和稳定的检测能力；同时，随着训练过程的进行，Agent开始适应任务场景，这就要求探索率逐渐降低，如公式所示：var＝var×0.9997；2构建MDP将优化目标描述为MDPMarkovdecisionprocess；通常，MDP可以表示为元组M＝S,A,P,R，其中S是状态空间，A是动作空间，Pst+1|st,at是转移概率，并且Rst,at是在动作at∈A被执行之后的瞬时奖励函数；本发明的目的是寻求一个最优策略π*·，使长期累计奖励最大化，可以定义为其中γ∈[0,1]表示折扣因子，对于越长远的未来，给与奖励打的折扣越大；3OU-TD3算法架构OU-TD3算法包含一个权重为φ的Actor主网络μs|φ，两个权重分别为θ1和θ2的Critic主网络以及权重为φ'的Actor目标网络μ's|φ'，权重为θ′1和θ′2的Critic目标网络Actor网络作为一个策略网络，即行动者产生行动，并通过最大化累积期望奖励来更新参数φ；Critic网络充当Q网络，即Critic，评估演员的表现，指导演员的下一个动作，并通过最小化评估值和目标值之间的损失误差来更新其参数θi值；S5、仿真与性能分析：进行数值模拟，以评估无人机辅助MEC系统中的OU-TD3计算卸载算法的性能；首先给予一个详细的描述的模拟参数；随后，在不同权重、不同任务规模、不同带宽条件和不同USVs计算能力下，将该算法与其他五种基准算法的平均计算开销进行了比较分析。

全文数据：

权利要求：

百度查询：东北大学秦皇岛分校基于深度强化学习的无人机辅助无人艇任务卸载方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种红外水平仪的放置底座

下一篇：一种新型动盖板

相关技术

一种红外水平仪的放置底座

一种新型动盖板

一种新式施工围挡

一种新型高防潮纤维板

一种皮带输送生产线防晃动结构

一种用于焦炭反应性加热炉的恒温测定组件

一种齿轮加工用的夹具

一种降低转向节磕碰伤的模具

一种五金生产用清洗装置

一种打印机墨粉盒粉仓刮板

可隐藏式转向系统

一种分捡操作设备

辅助相关技术

辅助支撑模组_台宝艾传动科技(昆山)有限公司_202420766887.4

配体辅助解离_尼科亚生命科学公司_202380016328.X

加垫辅助装置_上海飞机制造有限公司_202420015648.5

下车辅助装置_丰田自动车株式会社_202210735321.0

辅助支撑机构_台宝艾传动科技(昆山)有限公司_202420758098.6

行驶辅助装置_日立安斯泰莫株式会社_202380025246.1

建筑电线辅助布设装置_福建中诚诺建设工程管理有限公司_202420033202.5

驾驶员辅助系统_ZF主动安全和电子美国有限公司_201980040251.3

拉丝机放线辅助装置_山东未来智能技术有限公司_202420490451.7

一种术后辅助行走装置_杭州市临安区第一人民医院(杭州市临安区第一人民医院医共体)_202323669886.2

无人机相关技术

旋翼无人机_杭州极目智控科技有限公司_202421159135.8

一种无人机载物架及其无人机_天津众商科技集团有限公司_202323634656.2

车载无人机行车记录装置_华未来(深圳)飞行科技有限公司_202420755049.7

多无人机控制系统_彩虹无人机科技有限公司_202410858620.2

无人机机载处理载荷_武汉地大信息工程股份有限公司_202420085215.7

一种无人机干扰枪的天线系统及无人机干扰枪_华诺星空技术股份有限公司_202410894031.X

一种无人机外部储氢罐脱离装置、无人机及脱离方法_天目山实验室_202411320633.0

多无人机人工势场设计方法及多无人机协同避撞方法_海鹰航空通用装备有限责任公司_202310416370.2

一种桨叶可折叠的无人机旋翼结构和无人机_圆周(中山)复合材料技术有限公司_202420770158.6

一种无人机防护结构_边疆_202420760691.4

艇相关技术

水面艇多机协作设备_中国科学院自动化研究所_202410731993.3

一种水上智能救生艇_浙江鸿普科技有限公司_202420150731.3

一种无人艇定位避障系统及方法_北京航天发射技术研究所_202410808245.0

一种新型的无人艇用弹开式机舱罩_广州海工船舶设备有限公司_202411146326.5

基于DFNN和MPC的无人艇轨迹实时跟踪控制方法_上海大学_202410835908.8

基于无人艇的海上云雾协同观测方法和装置_中国气象局气象探测中心_202410849150.3

一种适用于极地重叠冰区的振动减阻两栖滑行艇_哈尔滨工程大学_202211298168.6

一种智能水上救援无人艇_枣庄学院_202420382916.7

一种无人艇布放装置_中国人民解放军陆军军事交通学院镇江校区_202420773716.4

一种无人艇水下目标检测方法_浙江省智能船舶研究院有限公司_202411302927.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度强化学习的无人机辅助无人艇任务卸载方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务