中国科学技术大学吴锋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利一种基于分层多智能体强化学习的多无人机调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118778700B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410894574.1,技术领域涉及:G05D1/695;该发明授权一种基于分层多智能体强化学习的多无人机调度方法是由吴锋;曲阳;马金洺设计研发完成,并于2024-07-04向国家知识产权局提交的专利申请。
本一种基于分层多智能体强化学习的多无人机调度方法在说明书摘要公布了:本发明公开了一种基于分层多智能体强化学习的多无人机调度方法,建立分层强化学习框架指导多无人机调度,所述分层强化学习框架包括上层管理者的指令生成和下层无人机的指令学习;上层管理者收集下层无人机的视野信息,对下层无人机给出更长时间尺度上的策略;下层无人机利用后继状态特征自动学习上层管理者发送的指令集,依据上层管理者发送的指令集和当前的视野观测执行具体决策。上述方法能实现多无人机协作的同时,增加对不同环境和不同无人机编队组成的泛化能力,增强算法的可扩展性,可应用于无人机提供临时通信服务、无人机物联网构建、移动边缘计算、多无人机跟踪等多无人机任务。
本发明授权一种基于分层多智能体强化学习的多无人机调度方法在权利要求书中公布了:1.一种基于分层多智能体强化学习的多无人机调度方法,其特征在于,所述方法包括: 步骤1、建立分层强化学习框架指导多无人机调度,所述分层强化学习框架包括上层管理者的指令生成和下层无人机的指令学习; 在步骤1中,在多智能体强化学习中,多无人机调度问题被定义为一个部分可观察马尔可夫决策过程POMDP,用M=N,S,O,A,R,γ,P表示,其中N={1,...,n}为智能体集合,即无人机个体集合;S是全局状态空间,不能被无人机个体直接获取;O=Xi∈NOi是无人机个体的联合观测空间,其中Oi表示第i个智能体的观测空间,Xi∈NOi表示各个智能体观测空间的笛卡尔积;A=Xi∈NAi是无人机个体的联合动作空间,其中Ai表示第i个智能体的动作空间,Xi∈NAi表示各个智能体动作空间的笛卡尔积;是奖励函数,其中表示一维实数空间;γ∈[0,1]是奖励折扣因子,γ值接近0则该部分可观察马尔可夫决策过程POMDP注重当前的奖励值,γ值接近1则注重未来的奖励值;P:S×A×S→[0,1]为状态转移概率函数; 在部分可观察马尔可夫决策过程POMDP的设置中,任务执行过程被划分为数个离散时间步;在某个时间步t中,智能体接收环境观测st∈O=Xi∈NOi,依据智能体的策略πa|s决定动作at∈A=Xi∈NAi,并得到当前时间步的奖励rst,at;同时环境根据当前状态观测、智能体动作以及状态转移函数P,跳转到下一个状态st+1;重复上述过程直到到达终止状态或时间步达到上限; 多智能体强化的任务是学习策略πa|s,在不同的状态下决定动作,以最大化期望累计奖励和,表达式为: 其中,表示求期望,且st,at的概率分布遵循策略πa|s; 奖励函数R采用无人机个体的服务质量QoS,即强化学习目标为最大化累计QoS; 在分层强化学习框架下,上层管理者获得环境奖励rs,a,即POMDP中的奖励,对下层无人机给出策略指导,记指令为z;下层无人机获得的奖励rs,a+rins,z,a包括环境奖励和内在奖励两部分,内在奖励rins,z,a由多智能体系统内部给出,用于引导下层无人机遵循上层管理者的指令z; 记上层管理者策略为πH,上层管理者策略πH接收状态观测s为输入,输出给下层无人机的指令z;上层管理者强化学习的目标为:给定当前下层策略,调整πH以最大化累计上层奖励之和QH,表达式为: 记下层无人机策略为πL,下层无人机策略πL接收状态观测s和上层指令z为输入,输出无人机的动作a;下层无人机强化学习的目标为:给定当前上层策略,调整πL以最大化累计下层奖励之和QL,表达式为: 不同层级分别应用强化学习算法,分别得到策略πL,πH; 步骤2、上层管理者收集下层无人机的视野信息,对下层无人机给出更长时间尺度上的策略; 步骤3、下层无人机利用后继状态特征自动学习上层管理者发送的指令集,依据上层管理者发送的指令集和当前的视野观测执行具体决策。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励