一种基于可持续学习的强化学习自动驾驶决策切换方法

导航：龙图腾网> 最新专利技术> 一种基于可持续学习的强化学习自动驾驶决策切换方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：武汉理工大学

摘要：本发明公开了一种基于可持续学习的强化学习自动驾驶决策切换方法及系统，涉及基于可持续学习的强化学习自动驾驶决策切换技术领域，包括创建多场景的决策环境，通过图神经网络搭建决策切换模型，调整决策切换模型中的各个参数，实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息，对决策切换模型进行可持续学习的设置，自动驾驶汽车驶入未知场景。本发明所述方法通过强化学习动作值函数能够表示该模型对于场景的不确定性的特性，将其动作值函数的倒数作为面对新场景时进行决策切换的标签依据，根据该值能够实现在未知场景中行驶时实现自动对应场景与决策之间的标签联系，并作为决策切换模型针对新场景的训练拟合标签。

主权项：1.一种基于可持续学习的强化学习自动驾驶决策切换方法，其特征在于：包括，创建多场景的决策环境，在划分的场景内进行强化学习决策模型的训练，得到多个收敛后的强化学习决策模型，并在各自场景中完成测试；通过图神经网络搭建决策切换模型，在所述场景中进行数据收集，并进行数据处理与数据集建立；调整决策切换模型中的各个参数，对所建立的数据集进行图结构化处理，并基于此数据集进行训练，获得能够准确识别所训练场景的决策切换模型；实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息，输入至决策切换模型并针对输出进行阈值筛选获得其对应决策标签，根据标签自动进行决策调用；对决策切换模型进行可持续学习的设置，选择回放训练的可持续学习方法，设置回放数据池以存放前期经过训练的场景以及车辆信息供后续持续学习进行数据集重构；自动驾驶汽车驶入未知场景，将利用可持续学习的设置进行可持续学习，获得收敛的决策切换模型，并对场景进行自动筛查，将未知场景转化为已知场景并根据决策切换模型的输出进行阈值筛选获取决策标签进行决策调用，完成在该未知场景的决策。

全文数据：

权利要求：

百度查询：武汉理工大学一种基于可持续学习的强化学习自动驾驶决策切换方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种破碎机

下一篇：一种烷基取代的6-烷基-4-胺基哒嗪或者其盐的合成方法

相关技术

一种破碎机

一种烷基取代的6-烷基-4-胺基哒嗪或者其盐的合成方法

大体积混凝土智能养护系统及养护方法

复合结构体、叶片

应用于变压器的载气注入振荡负压油气分离装置

一种单人辅助调整喷枪装置

一种智能饮水机及茶吧机的在线出水量实时校准系统

基于多单元麻山药等间距打孔填料作业一体机

基于令牌的认证方法、装置、设备及存储介质

一种数字自动化的钢绞线切割装置及切割方法

一种农产品种植用智能培育装置及其种植方法

一种可安装多种线缆的卡具

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于可持续学习的强化学习自动驾驶决策切换方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务