首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于安全强化学习的列车节能运行控制方法及相关装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:五邑大学

摘要:本发明实施例提供了一种基于安全强化学习的列车节能运行控制方法及相关装置。其中,方法包括:建立距离离散化的列车节能运行仿真环境,为满足列车运行过程中速度限制的约束,在网络训练中,通过一种安全动作重置机制来对不安全动作进行重置,考虑计划运行时间的约束下,以能耗最小为目标,设计了一种松弛的动态奖励函数,引导网络的持续进化至收敛。在真实的列车数据和线路信息上,验证了方法输出的运行控制策略符合预期,能够满足列车计划运行时间的要求,同时达到能耗最优的目标。基于此,本发明实施例能够加快最优策略的训练速度,保证了控制策略对列车运行的控制精度。

主权项:1.一种基于安全强化学习的列车节能运行控制方法,包括:根据列车运行过程的纵向受力情况,构建列车运行的动力学模型;基于距离维度对列车运行线路进行离散化,使列车运行策略优化符合马尔科夫决策过程的要求;根据列车的运行时间和运行能耗构建列车运行控制过程的马尔科夫模型;基于S-A2C强化学习算法,通过策略网络产生动作,在执行“状态-动作”中,通过环境评估动作的安全性,对非安全动作进行中途重置,直到满足列车运行的安全约束;按照最优策略的列车运行时间与列车运行能耗松呈现负相关的属性,松弛列车计划运行时间约束构建松弛的稀疏奖励函数;根据不同状态下,运行时间奖励与运行能耗奖励对于速度引导的贡献,构建动态的密集奖励函数;结合松弛的稀疏奖励函数和动态的密集奖励函数构造松弛的动态奖励函数;基于松弛的动态奖励函数优化列车节能运行控制策略。

全文数据:

权利要求:

百度查询: 五邑大学 基于安全强化学习的列车节能运行控制方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。