买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:交控科技股份有限公司
摘要:本申请提供基于强化学习的列车ATO控制方法、设备、存储介质,其中方法包括:每隔预设控制周期,将被控列车的当前状态信息和移动授权信息作为预先训练好的列车自动驾驶控制算法的输入,得到期望控制量;其中,列车自动驾驶控制算法基于强化学习训练环境训练,所述强化学习训练环境基于被控列车的动力学特性和被控列车的运行控制系统功能搭建;将期望控制量下发给被控列车,以使被控列车根据期望控制量,通过被控车辆的控制系统得出施加的牵引力制动力,控制被控列车运行,实现了列车运行安全、准时、节能、舒适、精确停车的多目标优化控制,增强列车自动驾驶控制算法自适应和泛化能力,适配多种运行场景的参数自适应,提升控制算法的鲁棒性。
主权项:1.一种基于强化学习的列车ATO控制方法,其特征在于,所述方法包括:每隔预设控制周期,将被控列车的当前状态信息和移动授权信息作为预先训练好的列车自动驾驶控制算法的输入,得到期望控制量;其中,列车自动驾驶控制算法基于强化学习训练环境训练,所述强化学习训练环境基于被控列车的动力学特性和被控列车的运行控制系统功能搭建;将所述期望控制量下发给所述被控列车,以使所述被控列车根据所述期望控制量,通过所述被控车辆的控制系统得出施加的牵引力制动力,控制所述被控列车运行;所述每隔预设控制周期,将被控列车的当前状态信息和移动授权信息作为预先训练好的列车自动驾驶控制算法的输入,得到期望控制量之前,还包括:对被控列车的动力学特性进行建模;基于建立的模型,结合所述被控列车的运行控制系统功能搭建强化学习训练环境;确定基于强化学习的列车自动驾驶控制算法架构;基于架构和所述强化学习训练环境,对列车自动驾驶控制算法进行训练,得到训练好的列车自动驾驶控制算法;所述基于架构和所述强化学习训练环境,对列车自动驾驶控制算法进行训练,得到训练好的列车自动驾驶控制算法,包括:基于架构和所述强化学习训练环境,得到状态空间,动作空间,折扣率,学习率;随机初始化表,其中,为状态空间中的状态标识,为动作标识,且对于任意状态和动作,;初始化起始状态;选择动作;执行动作,得到环境反馈的即时奖励和新状态;更新,其中,为新动作;更新状态;重复初始化起始状态的步骤及后续步骤,直至为终止状态;重复初始化起始状态的步骤及后续步骤,直至表收敛;得到训练好的列车自动驾驶控制算法。
全文数据:
权利要求:
百度查询: 交控科技股份有限公司 基于强化学习的列车ATO控制方法、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。