中国人民解放军国防科技大学李杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利基于多目标异步策略的通信感知任务分配方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120029326B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510512193.7,技术领域涉及:G05D1/46;该发明授权基于多目标异步策略的通信感知任务分配方法和装置是由李杰;熊泽昊;黄钰翀;习业勋;刘敏豪设计研发完成,并于2025-04-23向国家知识产权局提交的专利申请。
本基于多目标异步策略的通信感知任务分配方法和装置在说明书摘要公布了:本申请涉及一种基于多目标异步策略的通信感知任务分配方法和装置,所述方法根据带宽约束,将多智能体系统的分布式任务分配算法中的通信策略优化问题转化为异步约束分散部分可观测马尔可夫决策过程;根据异步约束分散部分可观测马尔可夫决策过程,构建考虑通信过程的异步约束多智能体强化学习环境;根据异步约束多智能体强化学习环境,采用多目标耦合PPO方法对分布式任务分配方法中的多目标异步通信策略进行优化,得到最终多目标异步通信策略;每架无人机采用最终多目标异步通信策略,完成无人机集群通信感知任务分配。本方法采用多目标耦合PPO方法同时减少带宽开销和最小化任务冲突,在通信效率和分配可靠性之间实现了更优的平衡。
本发明授权基于多目标异步策略的通信感知任务分配方法和装置在权利要求书中公布了:1.一种基于多目标异步策略的通信感知任务分配方法,其特征在于,所述方法适用于无人机集群实现通信感知任务分配,所述无人机集群中每架无人机部署一个智能体,由无人机集群构成一个多智能体系统,所述方法包括: 根据带宽约束,将所述多智能体系统的分布式任务分配算法中的通信策略优化问题转化为异步约束分散部分可观测马尔可夫决策过程; 根据所述异步约束分散部分可观测马尔可夫决策过程,构建考虑通信过程的异步约束多智能体强化学习环境; 根据所述异步约束多智能体强化学习环境,采用多目标耦合PPO方法对分布式任务分配方法中的多目标异步通信策略进行优化,得到最终多目标异步通信策略;所述多目标耦合PPO方法是指将拉格朗日松弛方法扩展到多智能体近端策略优化算法的方法,以分布式方式异步收集数据,然后采用拉格朗日函数在给定带宽需求约束下集中优化通信策略,实现多个目标的同时优化,得到最终多目标异步通信策略; 每架无人机采用所述最终多目标异步通信策略,完成无人机集群通信感知任务分配; 其中,所述异步约束分散部分可观测马尔可夫决策过程的元组为: ; 其中,表示异步约束分散部分可观测马尔可夫决策过程的元组,表示n个智能体的集合,S表示全局状态,和分别表示所有智能体在时间步t的观测值和动作集合,表示状态转移函数,表示新的全局状态,R表示奖励函数,γ∈[0,1]表示折扣因子,表示多个辅助约束,用于限制智能体策略的更新,表示第i个辅助约束,i=1,2,……,n; 所述异步约束分散部分可观测马尔可夫决策过程允许智能体异步地做出决策,每个智能体的目标是在最大化预期的折现回报,并满足所有辅助约束条件的情况下学习一个测量;辅助约束条件为: ; 其中,表示辅助约束函数,表示智能体j在时间步t获得的奖励,表示时间步t时的折扣因子,表示智能体j当前时间步长下的动作,为时间步t时的状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。