首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于A3C-SRU的智能车汇入车流方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京联合大学

摘要:本发明公开了一种基于A3C‑SRU的智能车汇入车流方法及系统,实施方法包括下述步骤:步骤一:由数码摄像头、多线激光雷达、毫米波雷达、gps定位系统等装置采取环境参数和车辆参数。步骤二:根据步骤一中提取的环境参数和车辆参数利用仿真软件搭建仿真环境平台。步骤三:根据步骤二中的仿真环境设置强化学习算法的参数以及约束条件。步骤四:根据步骤二搭建的仿真环境利用A3C‑SRU算法训练,以获得汇入车流场景的决策。步骤五:根据步骤四中的模型获得步骤二中的获得步骤二中的最优动作序列,保存训练后的模型,并将模型输入到智能车,实现汇入车流任务。本发明基于A3C‑SRU的智能车汇入车流算法根据步骤一到步骤五的设置,能够有效的实现实时地汇入车流任务。

主权项:1.一种基于A3C-SRU的智能车汇入车流方法,其特征在于:该方法包括如下步骤,步骤一:由数码摄像头、多线激光雷达、毫米波雷达、gps定位系统装置提取环境参数和车辆参数;步骤二:根据步骤一中提取的环境参数和车辆参数利用仿真软件搭建仿真环境平台;步骤三:在步骤二中的仿真环境平台中设置汇入车流的约束条件及强化学习方法的参数;步骤四:根据步骤二搭建的仿真环境利用深度强化学习A3C-SRU算法进行多回合训练,以获得汇入车辆的决策过程;步骤五:根据步骤四中训练后的决策过程获得步骤二中的最优动作序列,保存训练后的模型,并将训练后的模型输入到智能车,实现汇入车流任务;所述步骤一中的环境参数和车辆参数包括:环境中的车道的宽度d;环境中主路车道数n;环境中主路的长度L1以及汇入匝道的长度L2;环境中主路车辆的限速v主以及环境中匝道车辆限速v匝;主路的车流量N、加速度ac、速度vc、初速度vinit;车辆的长度cv和宽度wc;所述步骤二中具体的环境汇入场景构建如下:步骤21,利用仿真软件根据实际场景的车道的宽度d、环境中主路车道数n、环境中主路的长度L1以及汇入匝道的长度L2、环境中主路车辆的限速v主以及环境中匝道车辆限速v匝搭建实际场景的汇入车流环境;步骤22,输入所采集实际场景的主路的车辆量、车辆加速度、车辆速度、初速度、车辆长度和宽度数据;步骤23,根据步骤21、步骤22代建实际场景仿真平台,根据实际汇入车辆的设置汇入车辆信息;汇入车流的约束条件及强化学习算法的参数具体包括四元组空间st,at,rt,st+1,其中st为当前状态,at为当前状态所执行的动作值,rt为当前状态获得的奖惩函数值,st+1为下一个状态值;st为强化学习的状态空间,状态空间由5元组表示为:st=d1,d2,vh,vt1,vt2;式中,d1为与汇入车辆相邻车道相邻最近的主路的后车距离,d2为与汇入车辆相邻车道相邻最近的主路的前车距离,vh为汇入车辆的车速,vt1为与汇入车辆相邻车道相邻最近的主路的前车速度,vt2为与汇入车辆相邻车道相邻最近的主路的前车速度;at为强化学习的动作空间,动作空间由两元组表示为:at=av,wv式中,av表示汇入车辆的加速度变化,wv为汇入车辆方向盘转角;rt为强化学习中的奖惩函数,具体描述如下:1当车辆在单回合发生碰撞时,给予惩罚r1,其中,r10;当汇入车辆成功汇入车流时,给于奖励r1,其中,r10;2当车辆与汇入车辆相邻车道相邻最近的主路的前车距离d1和与汇入车辆相邻车道相邻最近的主路的前车距离d2同时达到一定距离L时,在单回合每步中,给予奖励r2,其中,r20;当不符合2的条件时,在单回合每步中,给予惩罚r2,其中,r20;3设置单回合每步的惩罚函数,给予每步的惩罚函数r3,其中,r30,当汇入时间步数越久,r3越大。

全文数据:

权利要求:

百度查询: 北京联合大学 一种基于A3C-SRU的智能车汇入车流方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。