买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种基于强化学习和可达集的安全轨迹规划方法与系统及系统,属于自动驾驶领域。本发明利用强化学习进行轨迹粗解生成,与基于搜索和采样的方法相比,计算效率更高,无需复杂繁琐的规则设计,具备学习进化的能力;利用可达集对轨迹粗解进行修正,并为轨迹优化问题提供约束条件,保障了车辆行驶的效率以及安全性;利用约束迭代线性二次型调节器进行轨迹优化,与二次优化算法相比,生成的轨迹曲率更小,轨迹舒适度更高。
主权项:1.一种基于强化学习和可达集的安全轨迹规划方法,其特征在于,包括如下步骤:步骤S1,构建智能体,具体包括:以当前车辆状态信息、其他车辆状态信息以及道路条件信息构建状态空间;以当前车辆的横向位置信息和纵向速度信息构建动作空间;以行驶舒适性、效率性以及安全性为评价指标构建奖励函数;以及设置初始策略网络;将智能体与环境进行交互训练,得到训练后的策略网络;步骤S2,利用纵向四次多项式和横向五次多项式生成当前车辆的规划轨迹,并计算当前车辆的可达集,所述可达集用于表征当前车辆的可行驶区域边界,利用可达集对当前车辆的规划轨迹进行修正,获得轨迹粗解;步骤S3,构建轨迹优化问题的目标函数,以加加速度代价、前轮转角角速度代价、轨迹曲率代价以及安全距离代价为评价指标对轨迹粗解进行优化,输出优化后的规划轨迹。
全文数据:
权利要求:
百度查询: 湖南大学 一种基于强化学习和可达集的安全轨迹规划方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。