一种基于离线强化学习的机甲车自动行驶训练与控制方法

导航：龙图腾网> 最新专利技术> 一种基于离线强化学习的机甲车自动行驶训练与控制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：兰州大学

摘要：本发明公开一种基于离线强化学习的机甲车自动行驶训练与控制方法，主要包括1人为控制机甲车按照制定路线行驶，获取机甲车行驶过程中的摄像头图像，位置信息和机甲车的状态信息，构建数据集；2使用离线强化学习算法在机甲车行驶数据集上训练，训练过程中在行驶控制指令中添加动作扰动；3获取机甲车的摄像头图像信息，使用特征网络提取机甲车自身位置和障碍物位置特征信息，Q网络和策略网络根据特征信息分别输出Q值和机甲车制行驶指令，设置安全性奖励函数和准确性奖励函数，智能体根据环境奖励反馈调整下一步行驶指令；4利用训练好的机甲车控制策略在真实环境中测试评估，迭代训练直到机甲车可以进行自动行驶和避障任务。

主权项：1.一种基于离线强化学习的机甲车自动行驶训练与控制方法，其特征在于，包括以下步骤：步骤1：通过使用机甲车遥控器或者APP去控制机甲车按照地面的指定路线行驶，当机甲车遇到障碍物时手动控制进行避障操作，收集机甲车行驶过程中的数据，存储机甲车在行驶过程中每个时刻的环境状态se、自身状态sm、机甲车控制行驶指令和奖励信息rt，也就是存储机甲车行驶过程的轨迹数据t，利用存储的这些数据构建机甲车行驶数据集步骤2：在机甲车行驶数据集上使用离线强化学习算法BCQ训练机甲车的自动行驶控制策略，将策略表示为π；首先从机甲车行驶数据集中采集样本，每个样本包括机甲车在当前时刻的观测s、机甲车做出的动作a、下一时刻的观测s′以及当前动作的奖励信息rt；所述机甲车对当前时刻的观测s包括环境状态se和自身状态sm，环境状态包括机甲车搭载的摄像头所获取到的图像视频信息，自身状态包括行驶速度、四个麦克纳姆轮中的发动机转速、机甲车所在的位置、机械云台旋转的角度、机甲车到障碍物的距离；根据机甲车的控制行驶指令做出动作a，包括前进、后退、左移、右移、以及机械云台的朝向；采集到的样本通过使用生成模型Gωs重新生成，增加扰动神经网络ξφs,a,v对动作添加扰动，扰动范围是[-φ,φ]，采用变分自编码器VAEEw1,Dw2，使得生成的状态动作对和机甲车在自动行驶过程中的状态动作对更加的相似；机甲车自动行驶控制策略π表示为步骤3：将机甲车在自动行驶过程中的状态动作对和机甲车行驶数据集中的状态动作对的相似度建模成一个状态条件概率策略训练过程中，尽量减少机甲车行驶数据集中不存在的状态和动作，进而减少机甲车对其Q值的推测误差，使其估计更准确；步骤4：训练两个动作值网络对动作的Q值进行评估，取它们的最小值作为动作值的估计；机甲车执行这个网络返回的动作a，环境根据机甲车的中心到指定路线的偏移距离和是否碰撞到障碍物返回给机甲车奖励信息，然后更新目标网络的参数θ和扰动网络算法的参数φ；步骤5：使用训练好的模型换到另外一条路线去测试机甲车的自动行驶控制策略，操作员时刻监测机甲车的自动行驶状态，收集其中完成程度比较好的数据，将其加入到机甲车行驶数据集对数据集进行随机分布；步骤6：迭代训练过程和测试过程，直到测试过程中机甲车可以自主完成行驶任务。

全文数据：

权利要求：

百度查询：兰州大学一种基于离线强化学习的机甲车自动行驶训练与控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种低品铬铁冷压球制造工艺

下一篇：一株噬尼古丁类节杆菌及其在聚乙烯塑料降解中的应用

相关技术

一种低品铬铁冷压球制造工艺

一株噬尼古丁类节杆菌及其在聚乙烯塑料降解中的应用

多相电感器及其制备方法、充电设备及电子设备

电网的故障处理方法、装置和电网故障检测系统

一种基于指数分解的区域水质影响因素贡献量化分析方法

一种金属烟道可调节搬运设备

自动适配开关实现低压直流无线智能灯配解网触发的系统、方法、装置、处理器及存储介质

一种基于复合磁路双闭环补偿的抗直流偏磁电流互感器

光学成像镜头

一种海陆生态综合监测系统及其使用方法

一种食品级不锈钢烤盘加工用翻边设备

一种造纸用自动切纸机

车相关技术

机动车近光灯及机动车_江苏信利电子有限公司_201810566264.1

电动车以及电动车的供电方法_氢驰动力科技(山西)有限公司_201811087059.3

托盘搬运车_广东嘉腾机器人自动化有限公司_202323623549.X

独轮车_东莞市比高德智能科技有限公司_202323465051.5

反侦察无人车_长沙冰眼电子科技有限公司_201710969760.7

纱筒转运车_福建长源纺织有限公司_202323518014.6

跨运车_河南港立重工装备有限公司_202411063654.9

自动引导车_芜湖灵动加速度机器人科技有限公司_202420567501.7

轨道测绘车调节系统_苏州米拓尔科技有限公司_202410616010.1

载车平台控制方法_奥动新能源汽车科技有限公司_202111165921.X

自动相关技术

自动行驶装置以及自动行驶装置的控制方法_三菱电机楼宇解决方案株式会社_202280092189.4

自动放板机_江门荣信电路板有限公司_202420493552.X

自动纠偏托辊结构_唐山兴德传动设备有限公司_202420499177.X

电机自动充磁机_浙江锋龙科技有限公司_202323421891.1

自动引导车_芜湖灵动加速度机器人科技有限公司_202420567501.7

全自动邦定机_深圳市凯达扬自动化有限公司_202410830867.3

自动开罐装置_广东博科电子科技有限公司_202411012931.3

自动喷塑装置_浙江五行光电高科有限公司_202420298288.4

自动涂胶设备_江苏杰士德精密工业有限公司_202323583115.1

自动分析装置_株式会社日立高新技术_202280093060.5

行驶相关技术

自动行驶装置以及自动行驶装置的控制方法_三菱电机楼宇解决方案株式会社_202280092189.4

电动行驶设备_南京泉峰科技有限公司_202410323098.8

一种转向减震行驶机构_山东曼大智能科技有限公司_202010770199.1

行驶路径生成装置以及控制装置_株式会社IHI_202080044397.8

汽车特殊地形行驶车轮辅助装置_攀枝花学院_201911201046.9

一种防止行驶中解锁的解锁装置_江苏启越轨道交通装备有限公司_202420366769.4

行驶策略控制方法、装置、车辆及存储介质_张家港长城汽车研发有限公司_202410737499.8

一种基于单目相机的车辆行驶状态检测方法和装置_浙江交投高速公路运营管理有限公司_202411266678.4

列车行驶路线图构建方法以及装置_内蒙古伊泰呼准铁路有限公司_202410778944.5

一种基于汽车行驶速度的电机控制装置_北京安利华汽车有限公司_202323557884.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于离线强化学习的机甲车自动行驶训练与控制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务