华中科技大学;武汉烽火技术服务有限公司高雅玙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学;武汉烽火技术服务有限公司申请的专利基于多智能体强化学习的WiFi智能多链路接入方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118741649B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410724834.0,技术领域涉及:H04W48/16;该发明授权基于多智能体强化学习的WiFi智能多链路接入方法及系统是由高雅玙;谭博文;肖泳设计研发完成,并于2024-06-05向国家知识产权局提交的专利申请。
本基于多智能体强化学习的WiFi智能多链路接入方法及系统在说明书摘要公布了:本发明属于网络运营服务技术领域,尤其涉及一种基于多智能体强化学习的WiFi多链路接入方法、系统,该方法包括:将WiFi多链路接入问题建模为一个统一的马尔可夫决策过程模型,定义其中的动作、状态以及奖励函数;AP侧获取每个多链路设备对单条链路的局部观测进行集中训练,利用MADDPG多智能体强化学习算法求解获得最优接入策略;AP将训练好的多智能体分发给对应的多链路设备;多链路设备在训练好的智能体指导下进行分布式多链路接入。本发明可以满足未来新兴应用的高吞吐需求,在各链路上本发明均可以实现比传统的基于DCF的接入的性能限更高的网络吞吐量,优化范围从11.2%到23.9%。
本发明授权基于多智能体强化学习的WiFi智能多链路接入方法及系统在权利要求书中公布了:1.一种基于多智能体强化学习的WiFi智能多链路接入方法,其特征在于,该方法包括: 步骤一,将WiFi多链路接入问题建模为一个统一的马尔可夫决策过程模型,定义其中的动作、状态以及奖励函数; 步骤二,AP侧获取每个多链路设备对单条链路的局部观测进行集中训练,利用MADDPG多智能体强化学习算法求解获得最优接入策略; 步骤三,AP将训练好的多智能体分发给对应的多链路设备; 步骤四,多链路设备在训练好的智能体指导下进行分布式多链路接入; 所述步骤一具体包括:引入新参数接入机会作为马尔可夫状态转换的时间点,并设计独立于链路传输参数的状态,从而建立针对不同链路的统一分布式部分可观测马尔可夫决策过程模型; 所述统一的分布式局部可观测马尔可夫决策过程模型,包含动作、状态及奖励函数,具体为: 动作,用a表示,其中其意义为智能体i∈{1,2,...,n}在链路j∈{1,2,3}上的第t次接入机会的动作是传输一个数据包,亦或是表现为等待; 状态,单个智能体的状态用s表示,其中包含过去M个历史时间步的动作-观测对,即: 其中即是智能体i在链路j上的第t次接入机会的动作-观测对,即智能体i的局部观测,其由两部分组成,第一部分为链路观测值具体来说: 即智能体对链路的局部观测包含四种,而为了阐述链路观测值的第二部分,引入新参数表示智能体i在链路j上距离上一次成功传输的接入机会数,而则表示除了智能体i的其他智能体在链路j上距离上一次成功传输的接入机会数,之后对两者进行归一化构成的第二部分,即其中以及 而对于集中训练时需要的联合状态,即 奖励函数,用r表示,智能体i在链路j上的第t次接入机会的总奖励用其定义为: 其中rj,t,global表示全局奖励,表示智能体i的个体奖励,α表示平衡系数,具体来说: 其中即智能体i的等待接入机会数占链路j上总等待接入机会总数的比例;而
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学;武汉烽火技术服务有限公司,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。