首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种高速铁路列车运行晚点时间预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东北大学

摘要:本发明提出一种高速铁路列车运行晚点时间预测方法,包括:得到历史数据集;使用Bootstrapping策略选取训练数据集和测试数据集,得到r个弱学习器集成随机权神经网络模型,使用WeightedVoting结合策略,得到强学习器Bagging‑RVFLNs预测模型;使用强学习器Bagging‑RVFLNs预测模型,针对给定的晚点时间及晚点车站,对所需预测的高速铁路列车晚点进行预测,得到晚点预测时间;使用强学习器Bagging‑RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间;若需要进一步提高晚点时间预测方法运算速度,使用在线序贯集成随机权神经网络模型代替强学习器Bagging‑RVFLNs预测模型;本发明使用了集成学习随即权神经网络实现对高速列车晚点时间的实时预测,预测精度较高,为高速铁路调度员的调度工作提供辅助。

主权项:1.一种高速铁路列车运行晚点时间预测方法,其特征在于,具体步骤如下:步骤1:获取高速铁路列车历史晚点数据并进行筛选,得到历史数据集,具体包括如下步骤:步骤1.1:获取所需预测的高速铁路列车对应线路上所有出现晚点的列车历史实绩数据和图定数据,根据实绩数据与图定数据计算列车进入区间或者到达车站的时间,记作列车当前时刻T、列车到达车站或者进入对应区间的晚点时间,记作列车在当前位置的晚点时间DT、列车从车站发车或者离开区间时减少的晚点时间,记作列车恢复时间RT、列车停站时间或在区间运行的时间,记作区间时间记作ST;步骤1.2:根据列车的型号与运行速度,筛选与待预测列车相同型号和相同运行速度的数据,并按照车站和运行区间分组,并去除异常数据,得到后续建立模型所需使用的历史数据集,即包括列车当前时刻T、列车在当前位置的晚点时间DT、列车恢复时间RT、区间时间记作ST,在历史数据集中所有数据单位均为分钟;步骤2:在历史数据集中,使用Bootstrapping策略选取训练数据集和测试数据集,对于每次选取的训练数据集合测试数据集建立集成随机权神经网络RVFLNs神经网络预测模型,得到r个弱学习器集成随机权神经网络模型,使用WeightedVoting结合策略,得到强学习器Bagging-RVFLNs预测模型;具体步骤包括步骤2.1~步骤2.6:步骤2.1:首先对共S组历史数据,利用Bootstrapping策略选取训练数据集和测试数据集:从S中取一条数据,把他标记成训练集数据,并将该数据重新放回,再次从S中取一条数据,标记为训练集数据,每次取出的数据会重复但也有始终没有取出过的,如此取s次,被取出的数据作为训练集,而未被取到的数据作为测试集,利用下面的公式得有N条数据的训练集,即得到训练集和测试集,其中,每组训练集包含数据N条,测试集包含数据M条,公式如下: 其中,s为数据组数,e为自然常数;步骤2.2:针对每次利用Bootstrapping策略选取训练数据集,得到训练数据集Z={xi,yi|xi∈Rn,yi∈Rm,i=1,2,…,N},其中,xi=[xi1,xi2,…,xin]T∈Rn,为n维的特征向量,yi=[yi1,yi2,…,yim]T∈Rm为m维的输出向量,设定隐含层有L个神经元,输入层和输出层无阈值,激活函数为gx的单隐层神经网络表示为: 其中,wi=[wi1,wi2,…,win]T是输入层神经元与第i个隐含层神经元之间的输入权值向量,βi=[βi1,βi2,…,βim]T是第i个隐含层神经元与输出层神经元之间的输出权值向量,oj是第j个样本的预测值,bi是第i个隐含层神经元的阈值,wi·xj表示wi与xj之间的内积;步骤2.3:随机生成wj和bj,j=1,2,…,L,计算并保存隐含层输出矩阵H:Hβ=Y其中,H代表隐含层输出矩阵,β代表输出权值矩阵,Y代表真实输出矩阵,且分别有如下表示: 为使得预测值与真实值之间的误差最小,表示为如下形式: 其中,||·||2为欧几里得范数,等价于存在βi,wi和bi,满足以下条件: 步骤2.4:求取和求得后神经网络,即建立集成随机权神经网络RVFLNs预测模型: 其中,||·||2为二阶范数;其中,i=1,2,…,L,为方便之后计算,在残差范数基础上再平方,不影响最后优化的参数结果,等价于最小化残差平方和损失函数: 步骤2.5:在历史数据集中,利用Bootstrapping策略选取训练数据集,重复步骤2.2~2.4,得到r个弱学习器集成随机权神经网络模型;步骤2.6:使用WeightedVoting结合策略对得到r个弱学习器集成随机权神经网络模型进行结合,得到强学习器Bagging-RVFLNs神经网络预测模型,弱学习器的输出用向量表示,其中对应第i个弱随机权神经网络在类别标记cj上的输出;WeightedVoting结合策略如下式所示: 其中,ωi是hi的权重,通常ωi≥0,得到的Hx是对应模型输入x的输出晚点时间;步骤3:使用强学习器Bagging-RVFLNs预测模型,针对给定的晚点时间及晚点车站,对所需预测的高速铁路列车晚点进行预测,得到晚点预测时间;使用强学习器Bagging-RVFLNs预测模型,对需要预测的晚点车次,在给定晚点时间的情况下,对于其在对应站或者区间的晚点时间变化进行预测,利用每个弱随机权神经网络学习器得到的权重矩阵wi=[wi1,wi2,…,win]T以及偏置矩阵βi=[βi1,βi2,…,βim]T预测,得到待预测列车的晚点预测时间;步骤4:对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束,具体包括步骤4.1和步骤4.2:步骤4.1:如果不需要提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束;步骤4.2:如果需要进一步提高晚点时间预测方法运算速度,则执行;判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,使用在线序贯集成随机权神经网络模型代替强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束。

全文数据:一种高速铁路列车运行晚点时间预测方法技术领域本发明高速铁路的调度领域,具体涉及一种高速铁路列车运行晚点时间预测方法。背景技术高速铁路高速度、高密度、高安全性的运行特性使其成为我国铁路客运的最重要方式之一。我国每日开行的高速客运动车组列车占全部客运列车的一半以上,承担着重要的运输任务。但列车在运行过程中发生会发生晚点,影响旅客的行程导致服务质量的降低,影响铁路正常运输任务的完成,严重时会带来巨大损失,因此保证高速列车的安全正点运行是十分必要的。高速列车运行是一个动态的过程,在运行过程中会受到环境因素、人为因素、列车故障等各类因素的影响而晚点,导致列车无法按图运行。在绘制基本运行图时,调度人员会在原有工作时间基础上增加一些缓冲时间,来提高运行图的稳定性,减少干扰带来的列车晚点。这部分缓冲时间分为区间缓冲时间和车站缓冲时间,在晚点发生后调度员将依据调度要求利用这些预留的缓冲时间恢复晚点。比如通过提高列车在运行中提高速度,或通过在车站完成接车任务旅客换程的工作基础上,通过提前发车来减少晚点时间。但根据现有的列车晚点预报方法,当列车发生晚点后,只能给出粗略的晚点估计时间,并且没有考虑晚点的发展和恢复情况,这种方法给出的晚点时间预测是十分不准确的。因此如何建立一个在确定列车发生初始晚点后,根据列车的晚点时间和后续的列车运行图等信息,给出晚点预测模型变得至关重要。鉴于高速铁路晚点时间预测的重要性,如何实现对于晚点的恢复时间进行估计,不但可以实现晚点的实时准确预测,而且对于高速铁路调度工作提供辅助,协助调度员调整运行图减少晚点的传播保证列车的正点运行。发明内容基于背景技术中的不足,本发明提出一种高速铁路列车运行晚点时间预测方法,具体步骤如下:一种高速铁路列车运行晚点时间预测方法,具体步骤如下:步骤1:获取高速铁路列车历史晚点数据并进行筛选,得到历史数据集,具体包括如下步骤:步骤1.1:获取所需预测的高速铁路列车对应线路上所有出现晚点的列车历史实绩数据和图定数据,根据实绩数据与图定数据计算列车进入区间或者到达车站的时间,记作列车当前时刻T、列车到达车站或者进入对应区间的晚点时间,记作列车在当前位置的晚点时间DT、列车从车站发车或者离开区间时减少的晚点时间,记作列车恢复时间RT、列车停站时间或在区间运行的时间,记作区间时间记作ST;步骤1.2:根据列车的型号与运行速度,筛选与待预测列车相同型号和相同运行速度的数据,并按照车站和运行区间分组,并去除异常数据,得到后续建立模型所需使用的历史数据集,即包括列车当前时刻T、列车在当前位置的晚点时间DT、列车恢复时间RT、区间时间记作ST,在历史数据集中所有数据单位均为分钟;所述异常数据:包括试跑的空车数据、运行图调整被取消的列车数据、人工发现的数据记录有问题的数据、以及部分缺少信息的数据;步骤2:在历史数据集中,使用Bootstrapping策略选取训练数据集和测试数据集,对于每次选取的训练数据集合测试数据集建立集成随机权神经网络RVFLNs神经网络预测模型,得到r个弱学习器集成随机权神经网络模型,使用WeightedVoting结合策略,得到强学习器Bagging-RVFLNs预测模型;具体步骤如下:步骤2.1:首先对共S组历史数据,利用Bootstrapping策略选取训练数据集和测试数据集:从S中取一条数据,把他标记成训练集数据,并将该数据重新放回,再次从S中取一条数据,标记为训练集数据,每次取出的数据会重复但也有始终没有取出过的,如此取s次,被取出的数据作为训练集,而未被取到的数据作为测试集,利用下面的公式得有N条数据的训练集,即得到训练集和测试集,其中,每组训练集包含数据N条,测试集包含数据M条,公式如下:其中,s为数据组数,e为自然常数。步骤2.2:针对每次利用Bootstrapping策略选取训练数据集,得到训练数据集Z={xi,yi|xi∈Rn,yi∈Rm,i=1,2,…,N},其中,xi=[xi1,xi2,…,xin]T∈Rn,为n维的特征向量,yi=[yi1,yi2,…,yim]T∈Rm为m维的输出向量,设定隐含层有L个神经元,输入层和输出层无阈值,激活函数为gx的单隐层神经网络表示为:其中,wi=[wi1,wi2,…,win]T是输入层神经元与第i个隐含层神经元之间的输入权值向量,βi=[βi1,βi2,…,βim]T是第i个隐含层神经元与输出层神经元之间的输出权值向量,oj是第j个样本的预测值,bi是第i个隐含层神经元的阈值,wi·xj表示wi与xj之间的内积。步骤2.3:随机生成wj和bj,j=1,2,...,L,计算并保存隐含层输出矩阵H:Hβ=Y其中,H代表隐含层输出矩阵,β代表输出权值矩阵,Y代表真实输出矩阵,且分别有如下表示:为使得预测值与真实值之间的误差最小,表示为如下形式:其中,||·||2为欧几里得范数,等价于存在βi,wi和bi,满足以下条件:步骤2.4:求取和求得后神经网络,即建立集成随机权神经网络RVFLNs预测模型:其中,||·||2为二阶范数;其中,i=1,2,…,L,为方便之后计算,在残差范数基础上再平方,不影响最后优化的参数结果,等价于最小化残差平方和损失函数:步骤2.5:在历史数据集中,利用Bootstrapping策略选取训练数据集,重复步骤2.2~2.4,得到r个弱学习器集成随机权神经网络模型;步骤2.6:使用WeightedVoting结合策略对得到r个弱学习器集成随机权神经网络模型进行结合,得到强学习器Bagging-RVFLNs神经网络预测模型,弱学习器的输出用向量表示,其中对应第i个弱随机权神经网络在类别标记cj上的输出。WeightedVoting结合策略如下式所示:其中,ωi是hi的权重,通常ωi≥0,得到的Hx是对应模型输入x的输出晚点时间;步骤3:使用强学习器Bagging-RVFLNs预测模型,针对给定的晚点时间及晚点车站,对所需预测的高速铁路列车晚点进行预测,得到晚点预测时间;使用强学习器Bagging-RVFLNs预测模型,对需要预测的晚点车次,在给定晚点时间的情况下,对于其在对应站或者区间的晚点时间变化进行预测,利用每个弱随机权神经网络学习器得到的权重矩阵wi=[wi1,wi2,…,win]T以及偏置矩阵βi=[βi1,βi2,…,βim]T预测,得到待预测列车的晚点预测时间。步骤4:对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束,具体包括步骤4.1和步骤4.2:步骤4.1:如果不需要提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束;步骤4.2:如果需要进一步提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,使用在线序贯集成随机权神经网络模型代替强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束。所述在线序贯集成随机权神经网络模型分为弱在线序贯随机权神经网络初始化训练阶段与强在线序贯随机权神经网络模型建立阶段:步骤4.2.1:弱在线序贯随机权神经网络初始化训练阶段,对于初始训练集设定激活函数和隐含层神经元数目,训练集样本数目大于隐含层神经元数目,即N0>L,选择Sigmoid激活函数gx:步骤4.2.2:在一定范围内随机产生输入权值wj和隐含层阈值bj,j=1,2,…,L并保存,进而计算出H0;输出权值矩阵其中的隐含层输出矩阵H0和输出矩阵Y0表示如下:步骤4.2.3:计算并保存输出权值其中,并初始化数据块批次k=0;步骤4.2.4:强在线序贯随机权神经网络模型学习阶段,当有一个新来的数据块时,计算其隐含层输出矩阵Hk+1;其中,N1为新来的数据块的样本数目,模型的优化目标函数转化为:输出权值矩阵计算公式为:再将K1继续拆分计算得到:根据上述公式又有:因此,其中,同理,写成一般的递推形式,即:对于第k+1个新来的数据块k≥0,Nk+1是第k+1个新来数据块样本的数目,其不局限为固定值,有如下形式:式中,步骤4.2.5:递推更新过程矩阵Kk+1、网络输出权值矩阵并保存;利用矩阵求逆公式Woodbury:设A,C和A+BCD均为非奇异方阵,有A+BCD-1=A-1-A-1BC-1+DA-1B-1DA-1对矩阵Kk+1的求逆进行递推分解:令则得到如下结果,步骤4.2.6:当再次获得新数据块时,即判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,令k=k+1,回到步骤4.4中继续训练更新当前模型。有益技术效果:本发明的目的是针对现有的列车晚点预测的方法的不准确,提出了一种基于列车运行的历史数据,使用了集成学习随机权神经网络,并使用在线序贯方法更新模型参数,来实现对高速列车晚点时间的实时预测,可以快速准确给出晚点列车后续的晚点发展变化情况。晚点问题一直是铁路部门关注的问题,同时也是旅客对于铁路服务的一项重要评价,晚点的变化和传播直接影响了后续列车运行安排调度工作,会影响到旅客的行程调整。本方法给出的基于数据的列车晚点预测方法,预测精度较高,运算速度快,能够预测高速列车在一定初始晚点水平、运行图结构下的后续晚点发展变化情况,可以为高速铁路调度员的调度工作提供辅助,协助调度员提高对列车后续运行情况的估计,合理的制定后续调度工作并辅助客运调度和其他调度台共同完成运输工作,在提高铁路调度工作方面具有一定的意义。附图说明图1是本发明具体实施方式中的一种高速铁路列车运行晚点时间预测方法流程图;图2是本发明具体实施方式中的集成学习随机权神经网络的算法结构原理图;图3是本发明具体实施方式中的随机权神经网络的算法结构原理图;图4是本发明具体实施方式中预测得到的晚点时间和实绩晚点时间比较图;图5是本发明具体实施方式中预测得到的晚点时间和实绩晚点时间预测误差;图6是不更新参数预测仿真结果;图7是单个弱学习器预测效果;图8是本发明具体实施方式中使用在线序贯方法仿真结果。具体实施方式下面结合附图和具体实施实例对发明做进一步说明,一种高速铁路列车运行晚点时间预测方法,如图1所示,具体流程如下:步骤1:获取高速铁路列车历史晚点数据并进行筛选,得到历史数据集,具体包括如下步骤:步骤1.1:获取所需预测的高速铁路列车对应线路上所有出现晚点的列车历史实绩数据和图定数据,根据实绩数据与图定数据计算列车进入区间或者到达车站的时间,记作列车当前时刻T、列车到达车站或者进入对应区间的晚点时间,记作列车在当前位置的晚点时间DT、列车从车站发车或者离开区间时减少的晚点时间,记作列车恢复时间RT、列车停站时间或在区间运行的时间,记作区间时间记作ST;步骤1.2:根据列车的型号与运行速度,筛选与待预测列车相同型号和相同运行速度的数据,并按照车站和运行区间分组,并去除异常数据,得到后续建立模型所需使用的历史数据集,即包括列车当前时刻T、列车在当前位置的晚点时间DT、列车恢复时间RT、区间时间记作ST,在历史数据集中所有数据单位均为分钟;所述异常数据:包括试跑的空车数据、运行图调整被取消的列车数据、人工发现的数据记录有问题的数据、以及部分缺少信息的数据;步骤2:在历史数据集中,使用Bootstrapping策略选取训练数据集和测试数据集,对于每次选取的训练数据集合测试数据集建立集成随机权神经网络RVFLNs神经网络预测模型,得到r个弱学习器集成随机权神经网络模型,使用WeightedVoting结合策略,得到强学习器Bagging-RVFLNs预测模型;具体步骤如下:步骤2.1:由于对于不同的车站和区间要建立不同的模型,因此以Ut车站为例进行说明。首先对共S=1000组历史数据,利用Bootstrapping策略选取训练数据集和测试数据集:从S中取一条数据,把他标记成训练集数据,并将该数据重新放回,再次从S中取一条数据,标记为训练集数据,每次取出的数据会重复但也有始终没有取出过的,如此取s次,被取出的数据作为训练集,而未被取到的数据作为测试集,利用下面的公式得有N条数据的训练集,即得到训练集和测试集,其中,每组训练集包含数据约630条,测试集包含数据约370条,公式如下:其中,s为数据组数,e为自然常数。步骤2.2:针对每次利用Bootstrapping策略选取训练数据集,得到训练数据集Z={xi,yixi∈Rn,yi∈Rm,i=1,2,…,N},其中,xi=[xi1,xi2,…,xin]T∈Rn,为n=4维的特征向量,yi=[yi1,yi2,…,yim]T∈Rm为m=1维的输出向量,设定隐含层有L=40个神经元,输入层和输出层无阈值,激活函数为gx的单隐层神经网络表示为:其中,wi=[wi1,wi2,…,win]T是输入层神经元与第i个隐含层神经元之间的输入权值向量,βi=[βi1,βi2,…,βim]T是第i个隐含层神经元与输出层神经元之间的输出权值向量,oj是第j个样本的预测值,bi是第i个隐含层神经元的阈值,wi·xj表示wi与xj之间的内积。其结构图如图3所示。步骤2.3:随机生成wj和bj,j=1,2,...,L,计算并保存隐含层输出矩阵H:Hβ=Y其中,H代表隐含层输出矩阵,β代表输出权值矩阵,Y代表真实输出矩阵,且分别有如下表示:为使得预测值与真实值之间的误差最小,表示为如下形式:其中,||·||2为欧几里得范数,等价于存在βi,wi和bi,满足以下条件:步骤2.4:求取和求得后神经网络,如图2所示,即建立集成随机权神经网络RVFLNs预测模型:其中,||·||2为二阶范数;其中,i=1,2,…,L,为方便之后计算,在残差范数基础上再平方,不影响最后优化的参数结果,等价于最小化残差平方和损失函数:步骤2.5:在历史数据集中,利用Bootstrapping策略选取训练数据集,重复步骤2.2~2.4,得到r个弱学习器集成随机权神经网络模型;步骤2.6:使用WeightedVoting结合策略对得到r个弱学习器集成随机权神经网络模型进行结合,得到强学习器Bagging-RVFLNs神经网络预测模型。弱学习器的输出用向量表示,其中对应第i个弱随机权神经网络在类别标记cj上的输出。WeightedVoting结合策略如下式所示:其中,ωi是hi的权重,通常ωi≥0,得到的Hx是对应模型输入x的输出晚点时间,并将其与测试数据集给出的输出晚点时间进行准确性验证。所述内容流程图如图2所示。步骤3:使用强学习器Bagging-RVFLNs预测模型,针对给定的晚点时间及晚点车站,对所需预测的高速铁路列车晚点进行预测,得到晚点预测时间;使用强学习器Bagging-RVFLNs预测模型,对需要预测的晚点车次,在给定晚点时间的情况下,对于其在对应站或者区间的晚点时间变化进行预测。本实施例仍使用Ut车站为例,利用每个弱随机权神经网络学习器得到的权重矩阵wi=[wi1,wi2,…,win]T以及偏置矩阵βi=[βi1,βi2,…,βim]T预测,得到待预测列车的晚点预测时间。并使用步骤2~3所述的结合策略得到晚点时间的最终预测结果。训练结果,不同车次的晚点预测时间,以及与实际晚点时间的误差,如图4与图5所示。步骤4:对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束,具体包括步骤4.1和步骤4.2:步骤4.1:如果不需要提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束;步骤4.2:如果需要进一步提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,使用在线序贯集成随机权神经网络模型代替强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束。所述在线序贯集成随机权神经网络模型分为弱在线序贯随机权神经网络初始化训练阶段与强在线序贯随机权神经网络模型建立阶段:步骤4.2.1:弱在线序贯随机权神经网络初始化训练阶段,对于初始训练集设定激活函数和隐含层神经元数目,训练集样本数目大于隐含层神经元数目,即N0>L,选择Sigmoid激活函数gx:步骤4.2.2:在一定范围内随机产生输入权值wj和隐含层阈值bj,j=1,2,…,L并保存,进而计算出H0;输出权值矩阵其中的隐含层输出矩阵H0和输出矩阵Y0表示如下:步骤4.2.3:计算并保存输出权值其中,并初始化数据块批次k=0;步骤4.2.4:强在线序贯随机权神经网络模型学习阶段,当有一个新来的数据块时,计算其隐含层输出矩阵Hk+1;其中,N1为新来的数据块的样本数目,模型的优化目标函数转化为:输出权值矩阵计算公式为:再将K1继续拆分计算得到:根据上述公式又有:因此,其中,同理,写成一般的递推形式,即:对于第k+1个新来的数据块k≥0,Nk+1是第k+1个新来数据块样本的数目,其不局限为固定值,有如下形式:式中,步骤4.2.5:递推更新过程矩阵Kk+1、网络输出权值矩阵并保存;利用矩阵求逆公式Woodbury:设A,C和A+BCD均为非奇异方阵,有A+BCD-1=A-1-A-1BC-1+DA-1B-1DA-1对矩阵Kk+1的求逆进行递推分解:令则得到如下结果,步骤4.2.6:当再次获得新数据块时,即判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,令k=k+1,回到步骤4.4中继续训练更新当前模型。仿真结果说明:1、不更新参数预测,即不使用步骤2步骤3对数据进行处理,直接使用步骤1数据进行预测的结果:原训练数据集包含数据1000条,新增训练集数据块包含数据600条,取300条新增数据使用原模型对进行预测,此时预测误差出现较大波动,如图6所示。如果出现预测模型准确度低于80%时,需要更新参数。2、更新模型参数,即使用步骤2与步骤3进行参数的更新:1不使用在线序贯需利用新数据重新建模,每个弱学习器随机权神经网络所需时间为t=0.0070,则生成强学习器需重复r次,取r=40,则总时间为t=0.28ss。单个弱学习器预测效果如图7所示;2使用在线序贯:更新每个弱学习器所用时间为t=0.005,同样对于更新r=40个弱学习器,在线序贯总时间节省t=0.08s,减少约30%的计算时间。目前所选训练集较小,可以理解尤其是对于新增较大数据集时,可以大幅减少模型训练所用时间,仿真结果如图8所示。采用在线序贯更新模型参数后的单个弱学习器预测效果如下:可以看出,在线序贯方式更新模型参数预测精度与使用重新训练模型的方式预测结果相近,并且可以节省计算时间。对于列车途径较多车站时,需建立多个模型进行预测时,节省运算时间更多。在线序贯是一种参数计算方法,是对于当新来一批晚点数据时,不需要完全重新训练模型,在原来模型参数基础上利用参数迭代公式可以得到新的模型,主要解决的减少更新模型的运算量来提高速度。举例说明在线序贯方法:列车现在在1车站,晚点10分钟,需要预测到达车站5时候晚点时间,需要建立5个单独的模型,每个模型都是一个强随机权神经网络,因为每段路线和车站的具体情况不同导致模型参数不同。十天后,列车b在1站晚点,预测其到区间4时的晚点,这十天积累了新的一批晚点数据,若需要更新模型参数,则可以采用在线序贯的方式,减少计算量。

权利要求:1.一种高速铁路列车运行晚点时间预测方法,其特征在于,具体步骤如下:步骤1:获取高速铁路列车历史晚点数据并进行筛选,得到历史数据集,具体包括如下步骤:步骤1.1:获取所需预测的高速铁路列车对应线路上所有出现晚点的列车历史实绩数据和图定数据,根据实绩数据与图定数据计算列车进入区间或者到达车站的时间,记作列车当前时刻T、列车到达车站或者进入对应区间的晚点时间,记作列车在当前位置的晚点时间DT、列车从车站发车或者离开区间时减少的晚点时间,记作列车恢复时间RT、列车停站时间或在区间运行的时间,记作区间时间记作ST;步骤1.2:根据列车的型号与运行速度,筛选与待预测列车相同型号和相同运行速度的数据,并按照车站和运行区间分组,并去除异常数据,得到后续建立模型所需使用的历史数据集,即包括列车当前时刻T、列车在当前位置的晚点时间DT、列车恢复时间RT、区间时间记作ST,在历史数据集中所有数据单位均为分钟;步骤2:在历史数据集中,使用Bootstrapping策略选取训练数据集和测试数据集,对于每次选取的训练数据集合测试数据集建立集成随机权神经网络RVFLNs神经网络预测模型,得到r个弱学习器集成随机权神经网络模型,使用WeightedVoting结合策略,得到强学习器Bagging-RVFLNs预测模型;具体步骤包括步骤2.1~步骤2.6:步骤2.1:首先对共S组历史数据,利用Bootstrapping策略选取训练数据集和测试数据集:从S中取一条数据,把他标记成训练集数据,并将该数据重新放回,再次从S中取一条数据,标记为训练集数据,每次取出的数据会重复但也有始终没有取出过的,如此取s次,被取出的数据作为训练集,而未被取到的数据作为测试集,利用下面的公式得有N条数据的训练集,即得到训练集和测试集,其中,每组训练集包含数据N条,测试集包含数据M条,公式如下:其中,s为数据组数,e为自然常数;步骤2.2:针对每次利用Bootstrapping策略选取训练数据集,得到训练数据集Z={xi,yi|xi∈Rn,yi∈Rm,i=1,2,…,N},其中,xi=[xi1,xi2,…,xin]T∈Rn,为n维的特征向量,yi=[yi1,yi2,…,yim]T∈Rm为m维的输出向量,设定隐含层有L个神经元,输入层和输出层无阈值,激活函数为gx的单隐层神经网络表示为:其中,wi=[wi1,wi2,…,win]T是输入层神经元与第i个隐含层神经元之间的输入权值向量,βi=[βi1,βi2,…,βim]T是第i个隐含层神经元与输出层神经元之间的输出权值向量,oj是第j个样本的预测值,bi是第i个隐含层神经元的阈值,wi·xj表示wi与xj之间的内积;步骤2.3:随机生成wj和bj,j=1,2,…,L,计算并保存隐含层输出矩阵H:Hβ=Y其中,H代表隐含层输出矩阵,β代表输出权值矩阵,Y代表真实输出矩阵,且分别有如下表示:为使得预测值与真实值之间的误差最小,表示为如下形式:其中,||·||2为欧几里得范数,等价于存在βi,wi和bi,满足以下条件:步骤2.4:求取和求得后神经网络,即建立集成随机权神经网络RVFLNs预测模型:其中,||·||2为二阶范数;其中,i=1,2,…,L,为方便之后计算,在残差范数基础上再平方,不影响最后优化的参数结果,等价于最小化残差平方和损失函数:步骤2.5:在历史数据集中,利用Bootstrapping策略选取训练数据集,重复步骤2.2~2.4,得到r个弱学习器集成随机权神经网络模型;步骤2.6:使用WeightedVoting结合策略对得到r个弱学习器集成随机权神经网络模型进行结合,得到强学习器Bagging-RVFLNs神经网络预测模型,弱学习器的输出用向量表示,其中对应第i个弱随机权神经网络在类别标记cj上的输出;WeightedVoting结合策略如下式所示:其中,ωi是hi的权重,通常ωi≥0,得到的Hx是对应模型输入x的输出晚点时间;步骤3:使用强学习器Bagging-RVFLNs预测模型,针对给定的晚点时间及晚点车站,对所需预测的高速铁路列车晚点进行预测,得到晚点预测时间;使用强学习器Bagging-RVFLNs预测模型,对需要预测的晚点车次,在给定晚点时间的情况下,对于其在对应站或者区间的晚点时间变化进行预测,利用每个弱随机权神经网络学习器得到的权重矩阵wi=[wi1,wi2,…,win]T以及偏置矩阵βi=[βi1,βi2,…,βim]T预测,得到待预测列车的晚点预测时间;步骤4:对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束,具体包括步骤4.1和步骤4.2:步骤4.1:如果不需要提高晚点时间预测方法运算速度,则执行:判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束;步骤4.2:如果需要进一步提高晚点时间预测方法运算速度,则执行;判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,使用在线序贯集成随机权神经网络模型代替强学习器Bagging-RVFLNs预测模型,对下一车站或者区间进行晚点时间预测,得到新的晚点预测时间,直到高速铁路列车晚点完全恢复或者到达终点结束。2.根据权利要求1所述一种高速铁路列车运行晚点时间预测方法,其特征在于,步骤1.2中,所述异常数据:包括试跑的空车数据、运行图调整被取消的列车数据、人工发现的数据记录有问题的数据、以及缺少信息的数据。3.根据权利要求1所述一种高速铁路列车运行晚点时间预测方法,其特征在于,步骤4.2中,所述在线序贯集成随机权神经网络模型分为弱在线序贯随机权神经网络初始化训练阶段与强在线序贯随机权神经网络模型建立阶段:步骤4.2.1:弱在线序贯随机权神经网络初始化训练阶段,对于初始训练集设定激活函数和隐含层神经元数目,训练集样本数目大于隐含层神经元数目,即N0L,选择Sigmoid激活函数gx:步骤4.2.2:在一定范围内随机产生输入权值wj和隐含层阈值bj,j=1,2,…,L并保存,进而计算出H0;输出权值矩阵其中的隐含层输出矩阵H0和输出矩阵Y0表示如下:步骤4.2.3:计算并保存输出权值其中,并初始化数据块批次k=0;步骤4.2.4:强在线序贯随机权神经网络模型学习阶段,当有一个新来的数据块时,计算其隐含层输出矩阵Hk+1;其中,N1为新来的数据块的样本数目,模型的优化目标函数转化为:输出权值矩阵计算公式为:再将K1继续拆分计算得到:根据上述公式又有:因此,其中,同理,写成一般的递推形式,即:对于第k+1个新来的数据块k≥0,Nk+1是第k+1个新来数据块样本的数目,其不局限为固定值,有如下形式:式中,步骤4.2.5:递推更新过程矩阵Kk+1、网络输出权值矩阵并保存;利用矩阵求逆公式:设A,C和A+BCD均为非奇异方阵,有A+BCD-1=A-1-A-1BC-1+DA-1B-1DA-1对矩阵Kk+1的求逆进行递推分解:令则得到如下结果,步骤4.2.6:当再次获得新数据块时,即判断高速铁路列车晚点是否完全恢复或者列车到达终点,若晚点没有完全恢复或者列车没有到达终点,则针对得到晚点预测时间作为输入,再次使用强学习器Bagging-RVFLNs预测模型,令k=k+1,回到步骤4.4中继续训练更新当前模型。

百度查询: 东北大学 一种高速铁路列车运行晚点时间预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。