首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

列车时刻表确定方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:交控科技股份有限公司

摘要:本发明提供一种列车时刻表确定方法、装置、设备及介质,涉及轨道交通技术领域,该方法包括:输入当前时间步的状态组至第一策略网络模型,获取当前时间步发车间隔;输入下一时间步的状态组至第二策略网络模型,获取下一时间步发车间隔;输入当前时间步的状态组及当前时间步发车间隔至第一价值网络模型,获取第一评价值;输入下一时间步的状态组以及下一时间步发车间隔至第二价值网络模型,获取第二评价值;输入目标时间步的状态组至第一策略网络模型,获取目标发车间隔;根据初始发车时刻以及目标发车间隔确定列车时刻表,本发明可操作性强,鲁棒性高,极大提高长交路模式下列车时刻表优化效率,并有效的降低地铁运营成本和乘客等待成本。

主权项:1.一种列车时刻表确定方法,其特征在于,包括:重复执行以下步骤,直至满足预设条件:在当前时间步的状态组为大交路状态组的情况下,根据大交路状态组所在的时间步相对应的车次的初始发车时刻,以及在所述大交路状态组所在的时间步相对应的车次沿线的所有大交路车站中,无法乘坐所述大交路状态组对应的车次列车的总遗留人数确定所述大交路状态组;在当前时间步的状态组为小交路状态组的情况下,根据小交路状态组所在的时间步相对应的车次的初始发车时刻以及在所述小交路状态组所在的时间步相对应的车次沿线的所有共有车站中,无法乘坐所述小交路状态组对应的车次列车的总遗留人数确定所述小交路状态组;所述共有车站为大交路沿线的所有车站与小交路沿线的所有车站中相重叠部分的车站;输入当前时间步的状态组至第一策略网络模型,获取所述第一策略网络模型输出的当前时间步发车间隔;输入下一时间步的状态组至第二策略网络模型,获取所述第二策略网络模型输出的下一时间步发车间隔;输入所述当前时间步的状态组以及所述当前时间步发车间隔至第一价值网络模型,获取所述第一价值网络模型输出的第一评价值;输入所述下一时间步的状态组以及所述下一时间步发车间隔至第二价值网络模型,获取所述第二价值网络模型输出的第二评价值;根据所述当前时间步发车间隔、所述第一评价值对所述第一策略网络模型进行更新;根据所述第一评价值、所述第二评价值对所述第一价值网络模型进行更新;所述第二策略网络模型是根据预设参数对第一策略网络模型进行更新而确定的,所述第二价值网络模型是根据所述预设参数对第一价值网络模型进行更新而确定的;在满足预设条件后,输入目标时间步的状态组至所述第一策略网络模型,获取所述第一策略网络模型输出的目标发车间隔;根据目标时间步的初始发车时刻以及所述目标发车间隔确定所述目标时间步的列车时刻表;所述状态组为大交路状态组或者小交路状态组中的任一状态组;所述时间步为预设时长的时间片段;所述根据所述当前时间步发车间隔、所述第一评价值对所述第一策略网络模型进行更新,包括:根据第一学习参数、当前时间步发车间隔的影响梯度以及第一评价值的影响梯度确定第一更新值;根据所述第一策略网络模型所对应的第一策略网络参数以及所述第一更新值确定更新后第一策略网络参数,以根据所述更新后第一策略网络参数对所述第一策略网络模型进行更新;所述根据所述第一评价值、所述第二评价值对所述第一价值网络模型进行更新,包括:根据乘客等待成本以及企业运营成本确定当前时间步的奖励函数;根据奖励函数以及所述第二评价值确定奖励目标;根据所述第一评价值以及所述奖励目标确定奖励误差;根据第二学习参数、所述奖励误差、所述第一评价值的影响梯度确定第二更新值;根据所述第一价值网络模型所对应的价值网络参数以及所述第二更新值确定更新后价值网络参数,以根据所述更新后价值网络参数对所述第一价值网络模型进行更新;所述乘客等待成本是根据当前时间步中所有车站中乘客所花费的总等待时间而确定的。

全文数据:

权利要求:

百度查询: 交控科技股份有限公司 列车时刻表确定方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。