首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习的自动驾驶汽车运动控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学

摘要:本发明涉及跟踪控制技术领域,尤其涉及一种基于强化学习的自动驾驶汽车运动控制方法,所提出的控制方案由基于批评‑评价机制强化学习算法设计的优化鲁棒转向控制器和基于径向基神经网络的识别者逼近器组成。在第一阶段,基于参考路径模型、车辆动力学模型和运动学模型,利用反步变结构控制设计基于强化学习的鲁棒转向控制器,抑制侧向路径跟踪误差,抵御未知外部干扰,保证自主车辆的横摆稳定性。在第二阶段,结合基于李雅普诺夫稳定性理论的自适应控制机制和径向基函数神经网络,通过学习近似任意非线性函数来补偿轮胎转弯刚度的不确定性,并保证闭环系统的全局渐近稳定性。

主权项:1.一种基于强化学习的自动驾驶汽车运动控制方法,其特征在于,所述方法包括以下步骤:S1、建立自主控制汽车系统动态模型;S2、建立汽车的转向系统模型;S3、结合自主控制汽车系统动态模型和转向系统建模,得到扭矩输入的人-机控制映射模型;S4、选定人-机控制映射模型中的状态变量,基于反步变结构技术和强化学习,进行自适应优化控制器设计,使用得到的优化的控制策略进行自动驾驶汽车运动控制,其中得到优化的控制策略为: ;其中,是系统状态,是系统阶数,和是正常数,是跟踪误差,表示优化后的虚拟控制律,表示优化后的实际控制律,和为基函数向量,和为有界的近似误差,s1,s2,s3,s4,s5均表示系统变量,是行动者的神经网络权重,为批评家的神经网络权重,为识别者的神经网络权重,其中基于评价-行动机制控制器的自适应更新律为: ;其中和为正的常数;针对扰动及非线性项逼近的识别者更新律为: ;其中表示正定常数矩阵,为常数;所述建立自主控制汽车系统动态模型包括:S11、建立二自由度车辆动力学模型: ;其中,为车身侧倾角,为车身偏航率,为车辆总质量,为纵向速度,为偏航惯性矩,和分别为重心到前轴和后轴的距离,和分别是前桥和后桥的轮胎侧向力;S12、将车辆动力学状态参数转换为与参考轨迹相关的状态参数,使用预测误差结合横向误差和偏航误差,得到车辆运动学模型为: ;其中,是横向速度,是载体的航向,是参考路径的航向,是恒定投影的距离,表示沿参考路径的距离;S13、根据对的小角度近似,并对式(1.5)的和求导得到: ;其中,K表示路径曲率;S14、消除预测误差和横摆角速度的振荡,得到如下关系: ;S15、将式(1.4)带入式(1.7)得到: ;S16、在未知外力干扰下,计算前后桥的轮胎侧向力为: ;其中,分别为前桥、后桥的轮胎过弯力,、分别为前桥、后桥的侧向未知外力干扰,分别为前桥、后桥的轮胎滑移角,为前桥轮胎过弯刚度,为后桥轮胎过A弯刚度,为轮胎与路面的附着系数;前后桥的轮胎滑移角满足要求: ;式中为前轮转向角,为车速;且满足具有非线性特性的转弯刚度: ;式中为前桥、后桥标称转弯刚度,分别为前后轮轮胎转弯刚度的不确定性;S17、结合式(1.8)-式(1.11),得到非线性车辆-道路系统模型: ;式中,S1,S2和S3是系统变量,光滑函数表示车辆的等效随机扰动;所述建立汽车的转向系统模型包括:初步建立转向系统模型为: ;重新表述为: ;式中和分别为转向系统的等效转动惯量和阻尼,为电机减速机构的减速比,为转向系统的减速比,为前轮转角,为驾驶员输入转矩,为转向负载转矩;拟合方程为: ;将和视作可实时测量值,为已知值,则式(1.14)中的视作已知项和光滑函数的和,其中是通过拟合式1.15得到的,是通过传感器测量得到的,是扭矩配合误差,是测量误差,得到转向系统的简化模型为: ;其中,系统变量;所述结合自主控制汽车系统动态模型和转向系统建模,得到扭矩输入的人-机控制映射模型包括:将式(1.12)和式(1.16)结合得到扭矩输入的人机控制映射模型: ;其中表示前轮角速度。

全文数据:

权利要求:

百度查询: 安徽大学 一种基于强化学习的自动驾驶汽车运动控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。