基于强化学习和事件触发预测的高速公路匝道管控方法

导航：龙图腾网> 最新专利技术> 基于强化学习和事件触发预测的高速公路匝道管控方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江省交通运输科学研究院

摘要：本发明属于高速公路交通管控分析技术领域，具体涉及基于强化学习和事件触发预测的高速公路匝道管控方法，在该方法中，首先构建模型预测控制器；然后构建强化学习智能体；其次构建结合强化学习的事件触发模型预测控制框架；并构建仿真环境，训练强化学习智能体；最后部署结合强化学习的事件触发模型预测控制框架，本发明通过结合模型驱动和数据驱动方法，将强化学习智能体嵌入到事件触发模型预测控制中，并构建仿真环境不断训练智能体，并且设计能够处理匝道管控问题约束和优化目标的模型预测控制器，由此不仅提升了高速公路匝道控制效果，还提高了高速公路匝道控制及时度，另外在一定程度上降低了由人工管控带来的管理成本。

主权项：1.基于强化学习和事件触发预测的高速公路匝道管控方法，其特征在于，包括以下步骤：步骤一：构建模型预测控制器；步骤二：构建强化学习智能体；步骤三：构建结合强化学习的事件触发模型预测控制框架；步骤四：构建仿真环境，训练强化学习智能体；步骤五：部署结合强化学习的事件触发模型预测控制框架；所述构建模型预测控制器参见下述过程：S1.1构建高速公路匝道管控优化目标：；其中，表示总旅行时间，主要包括车辆在途行驶时间和等待时间,表示车辆排队惩罚因子,表示车辆排队惩罚目标函数系数；S1.2构建高速公路匝道管控状态转移方程：；其中，表示状态转移方程，表示控制阶段，表示高速公路匝道交通流控制量，表示交通流密度，表示交通流流量，表示交通流速度，表示匝道排队长度，表示模型参数；S1.3构建高速公路匝道管控约束条件：；其中，表示约束条件方程；S1.4构建模型预测控制优化模型：；s.t. ；；其中，表示预测步长，通过求解上述优化模型可以获得最优控制序列,进而将第一个控制量实施到系统中从而达到控制效果；所述构建强化学习智能体实施如下：S2.1定义动作：，其中0表示模型预测控制器不触发，1表示模型预测控制器触发；S2.2定义动作定义状态：，其中表示状态观测位置的交通流密度，表示观测位置的匝道排队长度；S2.3定义奖励：，其中、对应高速公路匝道管控优化目标,对应考虑控制器触发成本；S2.4定义策略更新函数：，其中表示状态下采取动作的概率，表示学习率，表示折扣因子。

全文数据：

权利要求：

百度查询：浙江省交通运输科学研究院基于强化学习和事件触发预测的高速公路匝道管控方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种水利泵站施工用围堰测量放线装置

下一篇：一种多车型前悬拧紧机构自动切换机构

相关技术

一种水利泵站施工用围堰测量放线装置

一种多车型前悬拧紧机构自动切换机构

一种基于深度学习模型的电子合同管理方法及系统

一种卫星导航受控无线场模拟设计方法

雾化装置安全保护方法及雾化装置

一种基于FFmpeg插件实现快速视频转码的方法及系统

应用于多波束相控阵天线的多波束功分网络和馈电网络

一种高吸湿性橡胶的制造方法及其产品

一种基于相变材料与MIM结构的长波红外光吸收器

融合红外与可见光图像的道路裂缝分割系统的构建方法

一种大棚蔬菜幼苗生长周期便捷移植装置及其移植方法

一种基于衬偏技术的电压基准源

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于强化学习和事件触发预测的高速公路匝道管控方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务