首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种时空预测的后继强化学习的交通信号控制方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:之江实验室

摘要:本说明书公开了一种时空预测的后继强化学习的交通信号控制方法及装置,通过引入显示的基于时空特性的交通状态预测,采用LSTM及GAT网络分别基于时间相关性、空间相关性预测未来的微观状态,智能体使用当前和预测状态进行最优决策,可以充分利用交通数据的时空相关性,提高路网的通行效率。同时,将后继特征与深度强化学习相结合,把任务的估计奖励和任务的预期特征进行分离,可以更方便地进行交通灯控制任务的转移,提升交通灯控制模型的训练速度,以及提高了交通信号灯控制的准确性和智能化。

主权项:1.一种时空预测的后继强化学习的交通信号控制方法,其特征在于,包括:确定预设路口在当前状态下的状态数据,所述状态数据包括:基本路况状态、时序路况状态以及空间路况状态,所述基本路况状态包括所述预设路口在当前状态各车道的车道等待队列的长度,所述时序路况状态包含所述预设路口在当前状态前预设时间内的各车道的车道等待队列的长度,所述空间路况状态包含;所述预设路口与所述预设路口的邻居路口的交通状态;将所述基本路况状态输入到基本特征提取网络,得到基本路况特征,将所述时序路况状态输入到时序预测网络中,得到下一时刻的路况特征,作为第一路况特征,将所述空间路况状态输入到空间预测网络中,得到下一时刻的路况特征,作为第二路况特征;将所述基本路况特征、所述第一路况特征与所述第二路况特征进行拼接,将拼接后特征与预设动作输入到预设的预测模型中,得到当前状态对应的预测价值量;以最小化所述第一路况特征与下一状态的基本路况特征之间的差异,最小化所述第二路况特征与下一状态的基本路况特征之间的差异为优化目标,以及根据所述预测价值量,对所述预测模型、基本特征提取网络、时序预测网络以及空间预测网络进行训练,以通过训练后的预测模型、基本特征提取网络、时序预测网络以及空间预测网络进行交通信号灯控制。

全文数据:

权利要求:

百度查询: 之江实验室 一种时空预测的后继强化学习的交通信号控制方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。