首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于可持续学习的强化学习自动驾驶决策切换方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉理工大学

摘要:本发明公开了一种基于可持续学习的强化学习自动驾驶决策切换方法及系统,涉及基于可持续学习的强化学习自动驾驶决策切换技术领域,包括创建多场景的决策环境,通过图神经网络搭建决策切换模型,调整决策切换模型中的各个参数,实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息,对决策切换模型进行可持续学习的设置,自动驾驶汽车驶入未知场景。本发明所述方法通过强化学习动作值函数能够表示该模型对于场景的不确定性的特性,将其动作值函数的倒数作为面对新场景时进行决策切换的标签依据,根据该值能够实现在未知场景中行驶时实现自动对应场景与决策之间的标签联系,并作为决策切换模型针对新场景的训练拟合标签。

主权项:1.一种基于可持续学习的强化学习自动驾驶决策切换方法,其特征在于:包括,创建多场景的决策环境,在划分的场景内进行强化学习决策模型的训练,得到多个收敛后的强化学习决策模型,并在各自场景中完成测试;通过图神经网络搭建决策切换模型,在所述场景中进行数据收集,并进行数据处理与数据集建立;调整决策切换模型中的各个参数,对所建立的数据集进行图结构化处理,并基于此数据集进行训练,获得能够准确识别所训练场景的决策切换模型;实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息,输入至决策切换模型并针对输出进行阈值筛选获得其对应决策标签,根据标签自动进行决策调用;对决策切换模型进行可持续学习的设置,选择回放训练的可持续学习方法,设置回放数据池以存放前期经过训练的场景以及车辆信息供后续持续学习进行数据集重构;自动驾驶汽车驶入未知场景,将利用可持续学习的设置进行可持续学习,获得收敛的决策切换模型,并对场景进行自动筛查,将未知场景转化为已知场景并根据决策切换模型的输出进行阈值筛选获取决策标签进行决策调用,完成在该未知场景的决策。

全文数据:

权利要求:

百度查询: 武汉理工大学 一种基于可持续学习的强化学习自动驾驶决策切换方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。