基于双向深度强化学习的多无人船协同围捕训练方法

导航：龙图腾网> 最新专利技术> 基于双向深度强化学习的多无人船协同围捕训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学(威海);威海天帆智能科技有限公司

摘要：本申请属于无人船智能控制技术领域，提供一种基于双向深度强化学习的多无人船协同围捕训练方法，包括以下步骤：建立基于深度强化学习的多无人船的协同围捕模型，所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络；建立机动目标的逃逸模型，所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络；对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练，所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务。本申请提供的方法通过对深度强化学习训练方式进行优化，能够迅速提升多个无人船对各类机动目标进行高效协同围捕的能力。

主权项：1.一种基于双向深度强化学习的多无人船协同围捕训练方法，其特征在于，包括以下步骤：建立基于深度强化学习的多无人船的协同围捕模型，所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络；建立机动目标的逃逸模型，所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络；对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练，所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务，其中，所述机动目标在执行各次正向训练任务时分别使用所述逃逸模型中的至少两个非智能逃逸子模型以及至少一个逃逸策略网络对所述协同围捕模型进行深度强化学习训练，且机动目标在各次正向训练任务中的逃逸轨迹复杂程度依次提高；各个无人船在执行所述反向训练任务时基于已训练的协同围捕模型对所述至少一个逃逸策略网络进行深度强化学习训练，且最后一次反向训练任务先于最后一次正向训练任务被执行；所述非智能逃逸子模型所采用的逃逸策略包括以下逃逸策略中的至少两种：直线运动策略、S型机动策略，人工势场机动策略；每次正向训练任务包括以下步骤：S1，初始化多无人船协同围捕场景，包括确定围捕边界，随机确定各个无人船和机动目标的初始位置以及至少一个障碍物的位置；S2，获取各个无人船的运动学模型、状态空间、动作空间；S3，如果当前的正向训练任务为第一个正向训练任务，则通过对所述协同围捕模型进行初始化以确定所述围捕策略网络的参数，否则基于上一个正向训练任务的训练结果设定所述围捕策略网络的参数；S4，基于所述多无人船协同围捕场景及各个无人船的运动学模型、状态空间、动作空间，对所述协同围捕模型进行三个阶段的深度强化学习训练，所述三个阶段为准备阶段、包围阶段和围捕阶段。

全文数据：

权利要求：

百度查询：哈尔滨工业大学(威海) 威海天帆智能科技有限公司基于双向深度强化学习的多无人船协同围捕训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：高端计算机处理器用散热器及其制造方法

下一篇：光检测装置

相关技术

高端计算机处理器用散热器及其制造方法

光检测装置

用于对数据中心的PUE值的预测方法及系统

储能变流器及储能系统

内走线鱼竿的摇柄隐藏结构

一种膨化食品加工用粉碎装置

一种多光子显微镜中光亮强度的自动调节装置

情感分类模型训练方法、系统、情感分类方法及系统

塔式光热发电背板冲压平直度仿真模拟评价方法

一种高线吐丝管安装精确定位装置

适用于不同功能空间声场控制的音频处理系统及方法

一种高纯锆靶材及其制备方法和应用

船相关技术

船用电视支架_上海外高桥造船有限公司_202411125761.X

双燃料运输船_上海外高桥造船有限公司_202411124332.0

LPG船用信号中继箱、控制方法以及LPG船_友奇环境工程(上海)有限公司_202411248928.1

船用曲轴轴颈加工方法_上海船用曲轴有限公司_202410882778.3

中转泵船环保套管结构_珠海市德威资源开发有限公司_202420833671.5

船用洗衣晾晒系统及船舶_上海外高桥造船有限公司_202411394549.3

船用低压二氧化碳充装系统及汽车运输船_上海外高桥造船有限公司_202411143581.4

一种单桨船漩涡鳍装置_招商局金陵船舶(南京)有限公司_202420057836.4

一种船用显示装置_苏州百胜动力科技有限公司_202420836592.X

一种高性能船用阀门_青岛泓远阀门有限公司_202420415084.4

学习相关技术

一种基于深度学习的学习质量评价系统及方法_成都工业学院_202411444397.3

一种基于自监督学习的纵向联邦学习方法_上海工程技术大学_202410871430.4

机器学习模型的联邦学习中的压缩的梯度分组_高通股份有限公司_202380031178.X

学习机的控制方法、控制装置及学习机_深圳倍爱思科技有限公司_202411140185.6

学习系统、确定系统和预测系统以及学习方法、确定方法和预测方法_富士胶片株式会社_202380031812.X

人体穴位学习系统、学习方法及人体穴位模型制作方法_中医古籍出版社有限公司_202411333351.4

一种智能学习机_北京信息职业技术学院_202411010868.X

在内代理语音以促进任务学习_渊慧科技有限公司_202380031694.2

一种平板学习机_南京百舸争流网络科技有限公司_202411116116.1

一种学习桌_育才控股集团股份有限公司_202323640076.4

协同相关技术

基于Transformer的冲击地压时间-空间协同预测方法_中国矿业大学_202411010585.5

人机协同医疗教学交互方法和系统_温州医科大学_202411449183.5

无人环卫车协同作业的任务智能划分方法_酷哇科技有限公司_202411038769.2

协同处理含碳煤矸石与钢渣的方法_西安建筑科技大学_202310507051.2

协同防垢剂组合物及其使用方法_埃科莱布美国股份有限公司_202380031713.1

焊接协同实现方法、装置和电子设备_法奥意威(苏州)机器人系统有限公司_202411184094.2

多人协同维护交易报文的方法及装置_中国建设银行股份有限公司_202411173266.6

云边协同的数据交换方法_浙江简捷物联科技有限公司_202411431986.8

用于隧道施工的协同巡检方法及平台_中铁十二局集团有限公司_202411449836.X

一种蓄热体循环式低浓度含瓦斯气体流态化协同氧化装置及协同氧化方法_中国矿业大学_202010349478.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于双向深度强化学习的多无人船协同围捕训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务