一种时空预测的后继强化学习的交通信号控制方法及装置

导航：龙图腾网> 最新专利技术> 一种时空预测的后继强化学习的交通信号控制方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：之江实验室

摘要：本说明书公开了一种时空预测的后继强化学习的交通信号控制方法及装置，通过引入显示的基于时空特性的交通状态预测，采用LSTM及GAT网络分别基于时间相关性、空间相关性预测未来的微观状态，智能体使用当前和预测状态进行最优决策，可以充分利用交通数据的时空相关性，提高路网的通行效率。同时，将后继特征与深度强化学习相结合，把任务的估计奖励和任务的预期特征进行分离，可以更方便地进行交通灯控制任务的转移，提升交通灯控制模型的训练速度，以及提高了交通信号灯控制的准确性和智能化。

主权项：1.一种时空预测的后继强化学习的交通信号控制方法，其特征在于，包括：确定预设路口在当前状态下的状态数据，所述状态数据包括：基本路况状态、时序路况状态以及空间路况状态，所述基本路况状态包括所述预设路口在当前状态各车道的车道等待队列的长度，所述时序路况状态包含所述预设路口在当前状态前预设时间内的各车道的车道等待队列的长度，所述空间路况状态包含；所述预设路口与所述预设路口的邻居路口的交通状态；将所述基本路况状态输入到基本特征提取网络，得到基本路况特征，将所述时序路况状态输入到时序预测网络中，得到下一时刻的路况特征，作为第一路况特征，将所述空间路况状态输入到空间预测网络中，得到下一时刻的路况特征，作为第二路况特征；将所述基本路况特征、所述第一路况特征与所述第二路况特征进行拼接，将拼接后特征与预设动作输入到预设的预测模型中，得到当前状态对应的预测价值量；以最小化所述第一路况特征与下一状态的基本路况特征之间的差异，最小化所述第二路况特征与下一状态的基本路况特征之间的差异为优化目标，以及根据所述预测价值量，对所述预测模型、基本特征提取网络、时序预测网络以及空间预测网络进行训练，以通过训练后的预测模型、基本特征提取网络、时序预测网络以及空间预测网络进行交通信号灯控制。

全文数据：

权利要求：

百度查询：之江实验室一种时空预测的后继强化学习的交通信号控制方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种密封型储存罐

下一篇：一种林业树木用养护装置

相关技术

一种密封型储存罐

一种林业树木用养护装置

一种抽油泵保护支架

一种线切割清洁装置

一种工艺玻璃的着色搅拌装置

水稻种植的种子催芽器

一种智慧交通用移动信号灯

一种交联电缆紫外光辐照设备

车牌自动识别分拣线

一种印刷胶订生产线新型自动翻转机构

一种人体分区温度可调的供暖装置

一种双向进气填充气缸

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种时空预测的后继强化学习的交通信号控制方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务