恭喜山东大学朱文兴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜山东大学申请的专利基于多智能体强化学习的区域交通优化控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117475621B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311412460.0,技术领域涉及:G08G1/01;该发明授权基于多智能体强化学习的区域交通优化控制方法及系统是由朱文兴;龚宝林;张韬设计研发完成,并于2023-10-27向国家知识产权局提交的专利申请。
本基于多智能体强化学习的区域交通优化控制方法及系统在说明书摘要公布了:本公开提供了基于多智能体强化学习的区域交通优化控制方法及系统,涉及区域交通控制技术领域,单智能体动作价值网络采用集中式训练、分布式执行,包括:将所有交叉口的局部状态观测作为输入,输入至单智能体的动作价值网络中,使用多头注意力机制对交通区域某T时刻的各个交叉口重要程度分配权重,利用超网络对多头注意力机制产生的高维度数据进行融合,分布式输出各个动作的价值,选取最大价值所对应的动作,决策出各个交叉口在全局下的最优动作,实现对区域交通的最优控制。
本发明授权基于多智能体强化学习的区域交通优化控制方法及系统在权利要求书中公布了:1.基于多智能体强化学习的区域交通优化控制方法,其特征在于,包括:获取交通区域各个交叉口的流量数据,定义多智能体强化学习参数;所述定义多智能体强化学习参数,包括:定义多智能体强化学习中的全局观测状态矩阵、局部观测状态矩阵、联合动作、单智能体动作和奖励函数;定义局部观测状态矩阵=[交叉口编号,t时刻道路车辆数量信息,0,t时刻相位信息];构建单智能体动作价值网络,按照顺序部署智能体网络到对应的交叉口,获取各个交叉口的局部观测状态矩阵输入至动作价值网络中,利用输出的最大动作价值对应的动作进行控制执行,定义单智能体动作与多智能体联合动作,定义{,},表示t时刻该交叉口保持相位不变,表示t时刻该交叉口信号相位改变,i代表第i个交叉口,代表第i个交叉口的动作;在后续价值网络的输出中,通过: ,{,}来进行动作选择,其中,指的是动作价值网络对执行动作的估值,在t时刻,定义整个交通区域的全局联合动作为各个交叉口的动作线性组合,即: ={,,……}其中,表示t时刻,第i个交叉口的动作;其中,所述多智能体强化学习中的单智能体动作价值网络,具体包括:搭建单智能体动作价值网络,某个单智能体动作价值网络控制某个区域下的一个单点交叉口的交通,所述单智能体动作价值网络由多层感知机MLP、循环神经网络GRU以及多层感知机MLP组成,输入为多维的局部观测数据以及隐藏层数据,输出两维的动作价值数值;所述单智能体动作价值网络采用集中式训练、分布式执行,包括:将所有交叉口的局部状态观测作为输入,输入至单智能体的动作价值网络中,使用多头注意力机制对交通区域某T时刻的各个交叉口重要程度分配权重,利用超网络对多头注意力机制产生的高维度数据进行融合,分布式输出各个动作的价值,选取最大价值所对应的动作,决策出各个交叉口在全局下的最优动作,实现对区域交通的最优控制;所述使用多头注意力机制对交通区域中T时刻的各个交叉口重要程度分配权重,包括:多头注意力机制的值网络通过各个单智能体输出的动作价值数值进行输入,查询网络与键网络通过全局观测与局部观测进行输入,且均由基础的2层感知机网络组成,层间网络激活函数为RELU,通过softmax方法融合值网络,键网络,查询网络的输出并得到最终的注意力权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250061 山东省济南市历下区经十路17923号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。