基于深度强化学习的多水面自主航行器编队航行决策方法

导航：龙图腾网> 最新专利技术> 基于深度强化学习的多水面自主航行器编队航行决策方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连海事大学

摘要：本发明公开一种基于深度强化学习的多水面自主航行器编队航行决策方法，分别建立了领航者奖励函数以及基于考虑跟随者与障碍物间的距离的跟随者的奖励函数；进而根据所述领航者的总奖励值、领航者策略网络能够获取领航者的舵角、领航者的速度；同时根据有全球导航卫星系统和所述多水面自主航行器编队模型所获取的领航者的预测位置坐标，结合跟随者的总奖励值和跟随者策略网络，获取跟随者的舵角和跟随者的速度；最后通过跟随者的舵角、跟随者的速度、领航者的舵角和领航者的速度，实现对水面自主航行器编队航行进行控制。本发明根据虚拟领航者预计到达位置的坐标，来约束跟随者需要承担队形保持的任务执行，对领航者决策的依赖性较低，跟随者进行编队时的灵活性和适应性较强。并且基于领航者的控制指令较少，执行器的执行能耗大大降低，避免了出现执行器饱和的现象。

主权项：1.一种基于深度强化学习的多水面自主航行器编队航行决策方法，其特征在于，包括如下步骤：S1：建立船舶运动模型，以构建多水面自主航行器编队模型，获取跟随者编队距离误差；S2：建立基于领航者策略网络的领航者奖励函数，以获取领航者的总奖励值；根据所述跟随者编队误差，建立基于跟随者策略网络的考虑跟随者与障碍物间的距离的跟随者的奖励函数，以获取跟随者的总奖励值；S3：根据所述领航者的总奖励值、领航者策略网络，获取领航者的舵角、领航者的速度；S4：根据全球导航卫星系统和所述多水面自主航行器编队模型，获取领航者的预测位置坐标；S5：根据所述领航者的预测位置坐标、跟随者的总奖励值和跟随者策略网络，获取跟随者的舵角和跟随者的速度；S6：根据所述跟随者的舵角、跟随者的速度、领航者的舵角和领航者的速度，对水面自主航行器编队航行进行控制。

全文数据：

权利要求：

百度查询：大连海事大学基于深度强化学习的多水面自主航行器编队航行决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：人体属性的识别方法、装置、电子设备及存储介质

下一篇：一种飞机复合材料部件超规范修理专家系统

相关技术

人体属性的识别方法、装置、电子设备及存储介质

一种飞机复合材料部件超规范修理专家系统

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

逆变器动态功率解耦控制方法及装置

一种组合式固定件依附锁定器

牙冠的宽度数值确定方法、装置、设备及存储介质

性别判定模型的生成方法、装置、电子设备及介质

一种组装单元体用稳态调节控制系统

图像检测方法、装置、设备、存储介质及程序产品

一种有效微生物群活性菌剂及其应用方法

一种注册终端设备的方法及装置

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度强化学习的多水面自主航行器编队航行决策方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务