首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于模仿和强化学习的铁路选线方法、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中南大学;高速铁路建造技术国家工程研究中心

摘要:本申请涉及铁路线路技术领域,提供了一种基于模仿和强化学习的铁路选线方法、设备及介质。该方法包括:获取专家铁路线路数据以及实际交通设施信息,基于专家铁路线路数据获取专家铁路轨迹;利用线路生成模型在噪声范围内生成专家铁路轨迹对应的初始线路;按照初始线路被选择的概率进行排序,根据排序后初始线路获取奖励推断函数;将奖励推断函数作为PPO模型的评价网络并生成铁路线路;基于实际交通设施信息计算质量指标;根据质量指标获取线路质量;根据线路质量对线路生成模型和PPO模型进行优化得到最终线路生成模型和最终PPO模型;利用最终线路生成模型和最终PPO模型生成最终铁路线路。本申请的方法能提高铁路线路的合理性。

主权项:1.一种基于模仿和强化学习的铁路选线方法,其特征在于,包括:获取目标区域的多个专家铁路线路数据以及每个专家铁路线路数据对应的实际交通设施信息,并基于每个专家铁路线路数据获取专家铁路轨迹;利用线路生成模型在多个噪声范围内生成每条专家铁路轨迹对应的多条初始线路;按照每条专家铁路轨迹对应的每条初始线路被选择的概率将所述多条初始线路进行排序,并根据排序后所有专家铁路轨迹对应的多条初始线路获取奖励推断函数;将所述奖励推断函数作为PPO模型的评价网络,并利用所述PPO模型生成所述目标区域的多条铁路线路;分别针对每条铁路线路,基于所有专家铁路线路数据对应的实际交通设施信息计算所述铁路线路的建设困难度指标,并根据所述建设困难度指标计算所述铁路线路的质量指标;根据每条铁路线路的质量指标获取每条铁路线路的线路质量;根据所述多条铁路线路的线路质量对所述线路生成模型和所述PPO模型进行优化,并将优化后的线路生成模型作为最终线路生成模型,将优化后的PPO模型作为最终PPO模型;利用所述最终线路生成模型和所述最终PPO模型为待建设区域生成多条最终铁路线路;其中,所述基于每个专家铁路线路数据获取专家铁路轨迹的步骤包括:通过公式: 获取第个专家铁路线路数据对应的专家铁路轨迹;其中,表示第条专家铁路轨迹的第1个特征点的状态,表示所述第条专家铁路轨迹的第1个特征点的动作,表示所述第条专家铁路轨迹的第2个特征点的状态,,表示所述专家铁路线路数据的总数,所述第条专家铁路轨迹的第2个特征点的动作,表示所述第条专家铁路轨迹的第个特征点的状态,表示所述第条专家铁路轨迹的第个特征点的动作: 其中,表示所述第个专家铁路线路数据中第个特征点的横坐标,表示所述第个专家铁路线路数据中第个特征点的纵坐标,表示所述第个专家铁路线路数据中第个特征点的高程坐标,表示所述第个专家铁路线路数据中第个特征点的坡度,表示所述第个专家铁路线路数据中第个特征点的方位角,,表示所述第个专家铁路线路数据中最后一个特征点,表示所述第个专家铁路线路数据中特征点之间的距离,表示所述第个专家铁路线路数据中第个特征点的坡度变化值,表示所述第个专家铁路线路数据中第个特征点的方位角变化值;所述利用线路生成模型在多个噪声范围内生成每条专家铁路轨迹对应的多条初始线路,包括:利用行为克隆算法对第条专家铁路轨迹进行学习,得到第条专家铁路轨迹的专家策略;设定噪声集合;其中,表示第1个噪声,表示第2个噪声,表示第个噪声,;通过公式: 生成所述第条专家铁路轨迹在第个噪声范围内第个特征点的策略;其中,表示所述第条专家铁路轨迹的专家策略在第个特征点的策略,表示在第个噪声范围内生成的第个特征点的随机策略,,表示噪声总数,表示贪婪系数,,,表示所述专家铁路线路数据的总数,,表示初始线路的特征点总数;将所述第条专家铁路轨迹在第个噪声范围内所有特征点的策略进行整合,得到所述第条专家铁路轨迹对应的第条初始线路;所述将所述奖励推断函数作为PPO模型的评价网络,并利用所述PPO模型生成所述目标区域的多条铁路线路的步骤包括:PPO模型中的状态转移函数为:执行第个特征点的动作;若第个特征点为变坡点,即,,则第个特征点的状态为: ;若第个特征点为交点,即,,则第个特征点的状态为: ;其中,表示第个特征点的横坐标,表示第个特征点的纵坐标,表示第个特征点的高程,表示第个特征点的坡度,表示第个特征点的方位角,表示第条专家铁路轨迹中特征点之间的距离,表示第个特征点的坡度变化值,表示第个特征点的方位角变化值,表示第个特征点的横坐标,表示第个特征点的纵坐标,表示第个特征点的坡度,表示第个特征点的方位角,表示第个特征点的高程;当时,特征点的状态为预设状态。

全文数据:

权利要求:

百度查询: 中南大学 高速铁路建造技术国家工程研究中心 一种基于模仿和强化学习的铁路选线方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。