Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于模糊逆强化学习的无人车轨迹预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华东师范大学

摘要:本发明公开了一种基于模糊逆强化学习的无人车轨迹预测方法,包括如下步骤:计算轨迹特征、引入模糊逻辑进行逆强化学习来寻找最优权重向量、最优轨迹预测仿真。本发明主要通过处理无人车行驶轨迹数据及人类驾驶员的实际数据,结合模糊逻辑处理,训练逆强化学习模型,得到最优权重向量,从而在有限轨迹中计算出无人车的行驶最优轨迹。本发明解决了现有技术中无人车在行驶策略过程中对复杂环境适应性差和决策准确性低的问题,显著提高了无人车在实际道路环境中的行驶策略效率和安全性。引入模糊逆强化学习方法,使得无人车能够更好地学习人类驾驶员的行驶策略,从而实现更智能和安全的自动驾驶功能。

主权项:1.一种基于模糊逆强化学习的无人车轨迹预测方法,其特征在于,包括如下步骤:步骤一:计算轨迹特征,包含提取NGSIM数据集中的车辆数据,并对所述车辆数据进行去噪及归一化处理,随机提取预测轨迹,计算预测轨迹初始位置的前车位置、速度,轨迹结束位置的前车、后车的位置、速度信息,生成有限条同一初始位置的预测轨迹,并计算预测轨迹的特征向量texp和人类真实轨迹的特征向量th;步骤二:引入模糊逻辑进行逆强化学习以寻找最优权重向量θ*,包含初始化一个随机权重向量θ0,对有限条预测轨迹进行N次迭代,每次迭代中,初始化人类真实轨迹的特征期望值fexp和预测轨迹的特征期望值fh,并遍历步骤一随机提取人类真实轨迹对应的每一条预测轨迹,根据当前的权重向量θ的转置向量θT和轨迹特征t计算出每条轨迹的奖励r=θT·t,根据奖励r计算出每条轨迹的发生概率p;接着,用发生概率p和轨迹特征t计算出预测轨迹特征矩阵T=p·t和人类真实轨迹特征矩阵H=th,用于更新预测轨迹特征期望值fexp+=T和人类轨迹特征期望值fh+=H,遍历完全部预测轨迹后,对人类特征期望值进行模糊处理f'exp=fexp·u,对预测特征期望值进行模糊处理f'h=fh·u,u模糊因子;然后,计算梯度g=f'h-f'exp-λθ,再计算组合梯度gcomb=αg-βθ,其中,超参数α用于调节梯度,超参数β用于调节权重更新,最后,使用组合梯度计算最新的权重向量θ'=θ+lr·gcomb,将最新的权重向量θ'带入下一次迭代,如此反复,直至迭代结束,获得最终的权重向量θ*;步骤三:轨迹仿真预测,包含通过给定的行动组合生成有限条预测轨迹并计算轨迹特征,使用步骤二中最终生成的权重向量θ*,计算每一条预测轨迹奖励r,然后由奖励数值计算发生概率p,最终,选择发生概率最高的轨迹,作为车辆行驶的最优轨迹。

全文数据:

权利要求:

百度查询: 华东师范大学 基于模糊逆强化学习的无人车轨迹预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。