北京邮电大学胡智群获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利基于异构分层强化学习的交通信号灯和车辆协同控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119600826B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411800791.6,技术领域涉及:G08G1/07;该发明授权基于异构分层强化学习的交通信号灯和车辆协同控制方法是由胡智群;张员铭;张凯文;刘镕;路兆铭设计研发完成,并于2024-12-09向国家知识产权局提交的专利申请。
本基于异构分层强化学习的交通信号灯和车辆协同控制方法在说明书摘要公布了:本发明涉及交通信号灯和车辆协同控制技术领域,公开了一种基于异构分层强化学习的交通信号灯和车辆协同控制方法。本发明使用两类智能体对交通信号灯和CAV进行协同控制,两类智能体相互交互配合,提高混合交通流环境下的整体交通效率;两类智能体通过分层合作机制有效地进行信息沟通和任务协作,进一步提高交叉口的通行效率和CAV驾驶的安全性和舒适性;借助异构多智能体学习框架,对异构多任务进行有效协作学习,解决训练不稳定的问题,提高整体训练效果。
本发明授权基于异构分层强化学习的交通信号灯和车辆协同控制方法在权利要求书中公布了:1.一种基于异构分层强化学习的交通信号灯和车辆协同控制方法,其特征在于,包括以下步骤: S1、创建交通信号灯智能体和智能网联车智能体,初始化评论者网络、行动者网络以及对应的目标网络;交通信号灯智能体和智能网联车智能体采用分层合作机制,由交通信号灯管理者智能体为每个车道设定预期目标,控制每个车道上的智能网联车执行者智能体需要达到的期望状态,以进行信息沟通和任务合作; 根据交通信号灯的状态观测值、当前车道状态和车道索引值,定义交通信号灯管理者智能体在时刻状态的观测值为: 其中,表示交通信号灯的状态观测值,表示车道l的状态,表示车道索引值; 根据平均每车道每秒车辆排队数的负值,建立交通信号灯管理者智能体的奖励函数为: 其中,T表示管理者两次决策的间隔,表示交叉口所有的驶入车道,表示车道上的排队车辆数,k表示将两次决策之间的每秒排队车辆总数求和序号; 根据智能网联车智能体的状态观测值、当前状态的预期速度和下一时间段的预期速度,定义智能网联车执行者智能体在时刻状态的观测值为: 其中,表示智能网联车智能体的状态观测值,表示当前状态的预期速度,表示下一时间段的预期速度,表示智能网联车的最小控制步长,表示车辆到交叉口停车线的距离,表示车辆的速度; 根据智能网联车智能体的奖励和目标动作内在奖励,建立智能网联车执行者智能体的奖励函数为: 其中,表示内在奖励权重因子,表示剩余绿灯倒计时的归一化因子,表示智能网联车智能体的奖励,表示目标动作内在奖励; S2、初始化交通环境、路网环境和车流情况; S3、获取交通信号灯智能体与环境交互的观测值,根据观测值选择动作并计算奖励值,将一次动作轨迹存入交通信号灯经验回放池; S4、判断交通信号灯智能体的行动者网络是否开始更新;若是,则从交通信号灯经验回放池中批次抽样动作轨迹,计算评论者网络损失函数,并更新评论者网络参数;否则执行步骤S6; S5、判断交通信号灯智能体的目标网络是否开始更新;若是,则随机排列行动者更新顺序进行依次更新,根据更新后的行动者更新交通信号灯智能体的目标网络;否则执行步骤S6; S6、根据交通信号灯智能体的动作计算车道级目标,并获取智能网联车智能体的观测值,根据观测值选择动作并计算奖励值,将一次动作轨迹存入智能网联车经验回放池; S7、判断智能网联车智能体的行动者网络是否开始更新;若是,则从智能网联车经验回放池中批次抽样动作轨迹,计算评论者网络损失函数,并更新评论者网络参数;否则执行步骤S9; S8、判断智能网联车智能体的目标网络是否开始更新;若是,则计算智能网联车智能体的行动者网络目标函数,更新智能网联车智能体的行动者网络参数,根据更新后的行动者更新智能网联车智能体的目标网络;否则执行步骤S9; S9、判断交通信号灯智能体与环境交互是否达到最大交互次数;若是,则执行步骤S10;否则返回步骤S3; S10、判断是否达到最大迭代次数;若是,则流程结束;否则返回步骤S2。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100124 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励