浙江大学张凯元获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于分层强化学习的群体对抗系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115068953B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210657186.2,技术领域涉及:A63F13/67;该发明授权一种基于分层强化学习的群体对抗系统是由张凯元;杨博;张犁;李石坚;潘纲设计研发完成,并于2022-06-10向国家知识产权局提交的专利申请。
本一种基于分层强化学习的群体对抗系统在说明书摘要公布了:本发明公开了一种基于分层强化学习的群体对抗系统,包括上层宏观策略网络和下层微观动作网络;所述上层宏观策略网络包括多个智能体采用的多个策略网络和混合网络,每个策略网络用于依据当前时刻的观测状态和前多个时间步的子目标计算输出当前时刻的预测子目标;混合网络用于根据全环境状态信息、各子智能体采用策略网络输出的预测子目标计算输出宏观总目标作为下一时刻各智能体的子目标;所述下层微观动作网络包含多个智能体采用的多个DQN,每个DQN用于根据当前时刻的观测状态和当前时刻的子目标计算输出决策动作。该系统中智能体能够在兼顾宏观总目标和个体子目标的情况下生成更准确决策,适用于多智能体协同博弈对抗的游戏环境中。
本发明授权一种基于分层强化学习的群体对抗系统在权利要求书中公布了:1.一种针对战场对抗环境下的基于分层强化学习的群体对抗系统,其特征在于,应用于由对手智能体和队友智能体组成的协同博弈对抗的游戏环境中,上层的每个智能体有明确的战斗目标,即智能体攻击的对象,下层的智能体接收到上层攻击目标指令后,有明确的执行逻辑,即怎样行走来攻击上层给出的攻击目标;上层的多智能体在战术上采用括上层宏观策略网络,下层的多智能体在战术上采用下层微观动作网络; 所述上层宏观策略网络包括多个智能体采用的多个策略网络和混合网络,每个策略网络用于依据当前时刻的观测状态和前多个时间步的子目标计算输出当前时刻的分解值函数,从分解值函数中确定预测子目标;混合网络用于根据全环境状态信息、各子智能体采用策略网络输出的分解值函数计算输出联合值函数,从联合值函数中确定宏观总目标作为下一时刻各智能体的子目标;其中,全状态信息是指包含所有智能体的观测情况,包括视觉内存在的敌人或队友情况; 所述下层微观动作网络包含多个智能体采用的多个DQN,每个DQN用于根据当前时刻的观测状态和当前时刻的子目标计算输出决策动作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。