东南大学;苏州市轨道交通集团有限公司张宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学;苏州市轨道交通集团有限公司申请的专利基于深度强化学习的城轨客流与列车协同组织优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120218544B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510355798.X,技术领域涉及:G06Q10/0631;该发明授权基于深度强化学习的城轨客流与列车协同组织优化方法是由张宁;王占生;朱宁;王庆亮;谭琼亮;郭享;许常宜;乔立国;王道钢;岳孝昱;温龙辉设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。
本基于深度强化学习的城轨客流与列车协同组织优化方法在说明书摘要公布了:基于深度强化学习的城轨客流与列车协同组织优化方法,首先,基于轨道交通的自动售检票系统AFC数据,分析乘客的到站规律及出行链,并采用扩散模型生成轨道交通线网的OD矩阵。其次,构建反映列车运行与客流状态的仿真模型,为优化过程提供验证环境。针对列车运行方案与客流调度,设计深度Q网络DQN模型,并利用仿真模型进行训练和学习。该方法能够合理匹配客流需求与运力资源,有效缩短乘客候车时间,并降低列车的运营成本。
本发明授权基于深度强化学习的城轨客流与列车协同组织优化方法在权利要求书中公布了:1.基于深度强化学习的城轨客流与列车协同组织优化方法,其特征在于:包括以下步骤: 步骤1,利用轨道交通的AFC数据,分析乘客的到站规律及出行链,并构建客流OD矩阵; 步骤2,使用步骤1构建的客流OD矩阵来训练扩散模型,生成不同时段的客流OD矩阵,为列车运行与客流调度优化提供丰富的数据; 步骤3,以步骤2中扩散模型生成的OD矩阵为输入客流,依据城轨交通网络系统运行特征设计乘客、列车和车站元素的交互事件,模拟城轨系统的状态变化,构建基于离散事件的城市轨道交通网络仿真模型; 步骤3具体为: 3.1在基于离散事件的城市轨道交通网络仿真模型中,涉及三个主体,分别为轨道交通列车、轨道交通车站以及乘坐轨道交通出行的乘客; 列车是搭载乘客的载体,需要根据时刻表的要求在轨道线路上运行,列车属性包括编号、运行方向、线路编号、始发站、经停站和终点站; 车站是乘客集散的主要场所,车站属性包括站名、所属线路、是否为换乘车站、停靠列车的编号和当前站台乘客数量; 乘客是轨道交通系统中的服务对象,乘客属性包括编号、出发站、目的站、出行路径和进站时间; 3.2在基于离散事件的城市轨道交通网络客流仿真模型中,列车需要触发一系列事件来实现状态更新并与车站和乘客进行交互,事件包括列车初始化、列车运行以及停靠; 3.3在列车运行与客流状态的仿真模型中,乘客的事件包含初始化、进站、出站、候车、换乘和上下车; 所述3.3在列车运行与客流状态的仿真模型中,乘客的事件具体描述如下: 乘客初始化:在仿真开始时,根据步骤2生成的OD矩阵,生成乘客的初始信息,包括编号、出发站、目的站、出行路径和进站时间,用表示第时间粒度下从站点到站点的客流量;每个乘客的进站时间服从指数分布: ; 表示第至时间段内从站点到站点的乘客进站时间; 乘客的进站时刻为: ; 根据每个乘客的进站时刻,利用对数正态分布生成乘客出行过程中的相关时间,对数正态分布为: ; 式中,是生成时间的对数均值,是生成时间的标准差,而表示对数正态分布在处的概率密度,设定乘客的步行进站时间服从对数正态分布;乘客的换乘时间服从对数正态分布;乘客的步行出站时间服从对数正态分布; 生成乘客进站时间后,利用Logit模型分配乘客出行路径: ; 其中表示乘客在路径内选择路径的概率,表示OD矩阵对路径内所有可选路径,表示OD矩阵对路径的出行成本,表示的是乘客对城市轨道交通网络的熟悉程度,表示乘客对诱导信息的接受程度,表示诱导信息对路径选择的影响; 乘客进站、出站、候车、换乘、上下车:乘客根据生成的进站时间到达车站,列车则依据设定好的时刻表,在指定的时间内到达对应车站,这会触发乘客的上下车事件,乘客下车需要结合路径选择进行判断,如果不满足下车条件,则继续停留在列车上,如果满足条件则会触发乘客的换乘事件或出站事件,而乘客上车则受到列车方向、列车当前载客数以及乘客路径的约束,如果不满足上车条件则继续候车; 步骤4,在城市轨道交通网络仿真模型的基础上研究基于DQN的城轨客流与列车协同调度优化方法,以列车牵引能耗和乘客出行时间最小化为目标,在城轨运营规则的约束下构建DQN的系统状态、动作及奖励函数; 步骤4具体为: 将客流调度问题和列车运行优化问题建模为强化学习中的马尔可夫决策问题,利用DQN来寻找最优策略,其中学习过程包含以下: 系统状态:状态包括站台拥挤度、断面拥挤度、列车位置; 动作:列车发车间隔、区间运行时间、车站停靠时间、断面推荐,为0-1变量,当推荐该区段时为1,否则为0,; 奖励:基于优化目标设计,具体描述如下: 列车运营成本: ; 表示列车运营成本,表示单位距离的燃料成本,表示列车运行距离; 乘客的候车时间: ; 式中表示乘客的候车时间,表示列车抵达站台的进站时刻,由城市轨道交通网络仿真模型得到; 为了综合这些目标,将加权组合成一个总的奖励函数,目标是最大化该函数: ; 为列车运营成本所占权重、为乘客候车时间所占权重、为整体的缩放系数,、、的值均可根据实际中不同需求的侧重进行调整,用于平衡不同目标间的影响; 步骤5,为基于DQN的城轨客流与列车协同调度优化方法设计训练流程,通过训练得到优化后的调度策略,并将其应用于城市轨道交通系统的列车运行与客流调度,从而提升乘客出行体验和城市轨道交通的服务水平。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;苏州市轨道交通集团有限公司,其通讯地址为:210000 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励