恭喜浙江大学马东方获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学申请的专利基于强化学习的多智能混合式协同优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114528766B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210156023.6,技术领域涉及:G06F30/27;该发明授权基于强化学习的多智能混合式协同优化方法是由马东方;陈曦;金盛;王殿海设计研发完成,并于2022-02-21向国家知识产权局提交的专利申请。
本基于强化学习的多智能混合式协同优化方法在说明书摘要公布了:本发明公开了一种基于强化学习的多智能混合式协同优化方法。包括如下步骤:设置基于DQN的局部智能体,所述局部智能体为任一应用场景中单独对节点子问题进行决策的智能体;设置基于DQN的中心智能体,所述中心智能体为从全局层面对所述局部智能体进行策略调整的一个智能体;所述局部智能体通过优化局部节点实现分布控制;所述中心智能体通过评估局部智能体决策行为的优劣实现集中控制;每个局部智能体更新节点强化学习模型;中心智能体更新全局强化学习模型。通过实施本发明,能够在最大化全局回报的同时保留局部智能体独立决策的能力,降低了算法复杂度。
本发明授权基于强化学习的多智能混合式协同优化方法在权利要求书中公布了:1.一种基于强化学习的干道多智能混合式协同决策的信号优化方法,其特征在于,包括以下步骤:设置基于DQN的局部智能体,所述局部智能体为多个控制干道上单路口的智能体;设置基于DQN的中心智能体,所述中心智能体为从全局层面对所述局部智能体进行策略调整的一个智能体;所述局部智能体通过优化局部节点实现分布控制,所述优化局部节点包括获取相应路口当前状态数据输入至单路口强化学习模型进行处理,输出单路口所有动作的Q值,基于ε-greedy策略选择动作,并将所述动作作用于相应路口,得到相应路口的下一状态数据以及回报值;所述中心智能体通过评估局部智能体决策行为的优劣实现集中控制,所述评估局部智能体决策行为的优劣包括获取全局状态数据输入至全局强化学习模型进行处理,输出给每个局部智能体的评价,得到全局下一状态数据以及回报值;每个局部智能体更新单路口强化学习模型;中心智能体更新全局强化学习模型;所述单路口强化学习模型,包括:特征提取模块,利用卷积神经网络捕捉图像类信息的关键特征,并与数值类特性拼接为状态空间后输入至映射关系挖掘模块;映射关系挖掘模块,用于挖掘交通状态与潜在回报的映射模式,将来自特征提取模块的状态空间输入全连接层进行处理,再将得到的映射模式与当前相位信息输入至相位门控模块;相位门控模块,用于在模型训练阶段挖掘不同相位情况下的最佳输出,搭建个体相位分布式训练决策模型,宏观决策时利用当前相位对应的决策模型确定决策行为。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。