首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于MAPPO算法的WiFi网络资源调度方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华中科技大学

摘要:本发明属于网络资源调度技术领域,尤其涉及一种基于MAPPO算法的WiFi网络资源调度方法及系统,AP获取每个STA对应的缓存队列的相关信息;将OFDMA资源调度问题建模为一个部分可见马尔可夫决策过程,并定义其中的状态、动作以及奖励函数;采用MAPPO深度强化学习算法求解最优策略;根据最优策略来控制OFDMA资源单元的调度本发明可以在有效地保证时延敏感节点可靠性的同时,最大化带宽型业务节点的吞吐量。本发明通过合理地设置全局奖励函数中的权重参数,在网络带宽为20MHz且总数据输入速率不超过20Mbps的情况下能够保障高达92.67%的可靠性。本发明在时延敏感业务和带宽型业务节点共存的上行网络场景中展现出良好的稳定性与泛化能力。

主权项:1.一种基于MAPPO算法的WiFi网络资源调度方法,其特征在于,包括:S1,AP获取每个STA对应的缓存队列的相关信息;S2,将OFDMA资源调度问题建模为一个部分可见马尔可夫决策过程,并定义其中的状态、动作以及奖励函数;S3,采用MAPPO深度强化学习算法求解最优策略;S4,根据最优策略来控制OFDMA资源单元的调度;上行网络场景存在两种不同类型的节点,STA的个数为6,其中5个STA的业务均属于时延敏感类型,即每个STA均要求自己发送或接收的数据包的端到端时延在一定阈值内,另外还有1个STA是带宽型业务,其数据速率要求高,需要更大的带宽来满足需求;缓存队列信息包括缓存队列的长度和各个缓存队列中头包的排队时延;建立路口拥堵畅通状态模型具体为:应用多智能体深度强化学习,通过构建两种类型的资源调度智能体agent-ts和agent-th,并设计它们共享一个全局Critic网络,而各自拥有自己的Actor网络;通过采集智能体的本地观察和各自的动作集合,计算出全局的奖励值,并存储到经验回放池,用来更新Actor和Critic网络,优化WiFi网络资源的调度效率。

全文数据:

权利要求:

百度查询: 华中科技大学 一种基于MAPPO算法的WiFi网络资源调度方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。