买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:一种基于多智能体Actor‑Critic和GRU的城市大路网交通信号控制方法,具体步骤如下:S1、对于城市大型交通路网,将每个交叉口视为多智能体Actor‑Critic网络中的一个Agent,将路网上同一交叉口的车辆数量组合成对应交叉口的车辆总数Lkj,k表示从训练开始的第k时刻,j=1,2,…,N,N为路网中交叉口的总数;同时记录k时刻该交叉口所有车辆的平均行驶速度Tkj和信号灯状态信息Akj;S2、数据预处理,删去不符合逻辑的异常卡口数据;S3、搭建路网模型,用于神经网络的训练平台;S4、将步骤S1中获取的路网实时交通信息组合成Actor‑Critic训练中的状态信息Skj和信号灯动作信息即信号灯状态信息Akj,进行Actor‑Critic训练;S5、最终得到的训练模型,根据各交叉口的交通信息和信号灯状态信息确定下一个状态的灯态。
主权项:1.一种基于多智能体Actor-Critic和GRU的城市大路网交通信号控制方法,具体步骤如下:S1、对于城市大型交通路网,将每个交叉口视为多智能体Actor-Critic网络中的一个Agent,每一个Agent均有一个独立Actor-Critic网络,在一段连续时间内,每隔固定的采样间隔,通过道路上的卡口获取各条驶入交叉口车道的车辆数量queuei,其中i为单个交叉口上的车道编号,然后将路网上同一交叉口的车辆数量组合成对应交叉口的车辆总数Lkj,k表示从训练开始的第k时刻,j=1,2,…,N,N为路网中交叉口的总数;同时记录k时刻该交叉口所有车辆的平均行驶速度Tkj和信号灯状态信息Akj;S2、数据预处理,删去不符合逻辑的异常卡口数据;S3、搭建路网仿真模型,用于神经网络的训练平台;S4、将步骤S1中获取的各交叉口的车辆总数Lkj和所有车辆平均行驶速度Tkj组合成状态信息Skj和动作信息即信号灯状态信息Akj,输入Actor-Critic网络进行训练;S5、最终得到的训练模型,根据各交叉口的交通信息和信号灯状态信息,通过下式可以确定下一个状态的灯态:Ak+1j=argmaxQSkj,Akj其中QSkj,Akj为多智能体中单个Actor-Critic网络的Q值,argmax函数为QSkj,Akj达到最大值时变量的取值。
全文数据:
权利要求:
百度查询: 银江技术股份有限公司 浙江工业大学 一种基于多智能体Actor-Critic和GRU的城市大路网交通信号控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。