基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

导航：龙图腾网> 最新专利技术> 基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：合肥工业大学

摘要：本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法，包括：1、模拟十字路口车辆交汇路况，构建仿真场景，并对自动驾驶车辆进行动力学建模；2、根据环境信息，构建状态量，混合动作空间；3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈；4、构建深度神经网络，初始化深度强化学习参数，训练深度神经网络，产生针对被测车辆十字路口左转工况下，使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出，使其具有博弈行为，以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论，生成被测车辆在十字路口遭遇博弈性交汇场景，以提供构建自动驾驶场景的新方式。

主权项：1.一种基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法，其特征在于，是应用于在同一车道上行驶的前、后两辆自动驾驶车辆agent1、agent2阻止对向不同车道上的测试车辆ego在十字路口进行左转的自动驾驶场景中，并包括如下步骤：步骤1、获取位于前方的自动驾驶车辆agent1的加速度aagent1以及位于后方的自动驾驶车辆agent2的加速度aagent2的上限amax和下限amin，并将aagent1和aagent2作为一个动作参数；步骤2、以车辆自身中心为原点，以车辆沿着道路行驶的方向为纵向、以垂直于道路行驶的方向为横向，建立车辆Frenet坐标系；根据自动驾驶车辆采集的环境信息，并结合动力学模型，构建一个状态参数s＝xagent1-xego,yagent1-yego,vagent1-vego,aagent1-aego,xagent2-xego,yagent2-yego,vagent2-vego,aagent2-aego,θego，其中，xagent1表示位于前方的自动驾驶车辆agent1的横向坐标，xagent2表示位于后方的自动驾驶车辆agent2的横向坐标，yagent1表示位于前方的自动驾驶车辆agent1的纵向坐标，yagent2表示位于后方的自动驾驶车辆agent2的纵向坐标，xego表示被测车辆ego的横向坐标，yego表示被测车辆ego的纵向坐标，vagent1表示位于前方的自动驾驶车辆agent1的车速，vagent2表示位于后方的自动驾驶车辆agent2的车速，vego表示被测车辆ego的车速，aagent1表示位于前方的自动驾驶车辆agent1的加速度，aagent2表示位于后方的自动驾驶车辆agent2的加速度，θego表示测试车辆ego的航向角；步骤3、构建由四个组成部分组成的奖励函数，用于同一车道上前、后两辆自动驾驶车辆agent1、agent2与测试车辆ego之间的博弈；步骤4、构建深度神经网络，包括：策略网络和评价网络，其中，所述策略网络包含：连续动作网络和离散动作网络；获取历史状态参数集S＝{si|i＝1,2,…,n}，其中，si表示第i步的状态，n表示经验池容量上限；将历史状态参数集S输入策略网络中进行处理，得到动作参数集A＝{ai|i＝1,2,…,n}，其中，ai表示第i步的动作，且ai＝{ci,di|ci∈C,di∈D}；C＝{ci|i＝1,2,…,n}为连续动作参数，D＝{di|i＝1,2,…,n}为离散动作参数，ci表示两辆自动驾驶车辆agent1、agent2在第i步的动作参数，di表示两辆自动驾驶车辆agent1、agent2在第i步是否进入十字路口的决策参数；将si,ai,si+1,Ri作为第i条样本存入经验池中；其中，si+1表示第i+1步的状态；步骤5、基于历史状态参数集S和动作参数A，利用H-PPO算法对所述深度神经网络进行训练，并计算奖励函数，得到最优阻止左转模型；步骤6、将当前场景在第i步的状态参数si输入最优阻止左转模型中，并输出当前场景在第i步的最优动作参数c*i与第i步的最优决策参数d*i，作为两辆自动驾驶车辆agent1、agent2在第i步加速度与动作决策，以阻止测试车辆ego在第i步换道。

全文数据：

权利要求：

百度查询：合肥工业大学基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种不需要反洗和化学清洗的水处理方法及系统

下一篇：导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

相关技术

一种不需要反洗和化学清洗的水处理方法及系统

导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

主辅一体型轴向柱塞泵

半导体存储器件

面向语义通信的数字无线传输方法及系统

一种GIS设备机械振动状态预测方法、装置、设备及存储介质

一种吸入式制剂、迭代优化流程及其应用

一种环栅堆叠纳米器件及其制备方法

生活垃圾填埋场内垃圾堆体边坡的绿化结构及施工方法

一种TE₅模式和TM₂模式之间转换的双层绝热转换器

指纹识别组件及智能门锁

一种基于牙颌面畸形锥束CT图像的三维颌面重建方法

车辆相关技术

车辆及车辆落水救援的方法_奇瑞汽车股份有限公司_202411043939.6

车辆仪表板和车辆_徐州徐工汽车制造有限公司_202011210451.X

车辆温度调节系统及车辆_中国科学院理化技术研究所_202310357896.8

车辆控制装置及车辆控制方法_日立安斯泰莫株式会社_202280092270.2

用于车辆的减振器及车辆_比亚迪股份有限公司_202410841541.0

车辆的控制方法、装置以及车辆_华为技术有限公司_202310388931.2

车辆锁定方法、装置、设备及车辆_长城汽车股份有限公司_202410843682.6

车辆的控制电路和车辆_天津鼎佳智控汽车技术有限公司_202420200568.7

车辆控制装置及车辆控制方法_株式会社斯巴鲁_202380014334.1

车辆侧围、白车身及车辆_重庆长安汽车股份有限公司_202411050177.2

驾驶相关技术

驾驶辅助方法及驾驶辅助装置_日产自动车株式会社_202280093573.6

智能驾驶交互模拟系统_浙江科驰智能科技有限公司_202411033097.6

车辆驾驶辅助装置、车辆驾驶辅助方法以及非瞬时性存储介质_丰田自动车株式会社_202410386120.3

一种驾驶员个性化驾驶意图预测方法及系统_北京科技大学_202410909042.0

驾驶员监视装置、驾驶员监视方法以及程序_丰田自动车株式会社_202410400012.7

自动驾驶控制装置及其方法_现代自动车株式会社_202410187865.7

驾驶辅助方法、存储介质以及车辆_长城汽车股份有限公司_202110414306.1

一种无人驾驶车辆_广东科学技术职业学院_202210177976.0

新型无人驾驶移动充电桩_江苏悟飞能源科技有限公司_202411055132.4

自动驾驶控制系统_丰田自动车株式会社_202010993354.6

动态相关技术

双尾动态比较器_上海壁仞科技股份有限公司_202411259257.9

锁存电路、动态锁存器、动态D触发器及相关装置_深圳比特微电子科技有限公司_202410758098.0

动态缆海床固定装置及抗压缩动态缆系统_中天科技海缆股份有限公司_202411179305.3

动态阻抗电路及信号检测电路_深圳线易微电子有限公司_201810758533.4

一种全动态座椅_圣奥科技股份有限公司_202111659128.5

一种基于延误的管型航路网络动态设计及动态使用方法_南京航空航天大学_202010984372.8

一种动态矫正椎体束缚装置_北京市春立正达医疗器械股份有限公司_202411106365.2

一种票据动态码检验系统和方法_湖南一路畅行互联科技有限公司_201911127497.2

应用动态编码的智能交通监控系统_温州杰默科技有限公司_202410790943.2

一种身份动态识别方法和装置_华南师范大学_202410899238.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务