南京邮电大学陈美娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于深度强化学习的空天地网络拥塞控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120223635B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510664097.4,技术领域涉及:H04L47/12;该发明授权一种基于深度强化学习的空天地网络拥塞控制方法是由陈美娟;叶润雨设计研发完成,并于2025-05-22向国家知识产权局提交的专利申请。
本一种基于深度强化学习的空天地网络拥塞控制方法在说明书摘要公布了:本发明公开了一种基于深度强化学习的空天地网络拥塞控制方法,通过分布式节点协作与动态服务速率调整,实现快速动态响应与全局资源优化。该方法基于多节点智能体马尔可夫决策过程建模,设计复合奖励函数,并以此驱动策略优化算法训练;框架上采用“集中训练‑分布式执行”框架,在集中训练阶段优化策略网络参数,在分布式执行阶段各节点基于本地观测独立调整各节点服务速率,无需全局通信。针对卫星网络高动态拓扑及资源受限特性,使用MPLS流量工程协议构建标签交换路径,能够动态适配链路容量波动与卫星轨道移动。本发明实现了空天地节点拥塞控制的精准队列控制并显著提升网络的吞吐量,为空天地网络的高效拥塞控制提供了可靠的解决方案。
本发明授权一种基于深度强化学习的空天地网络拥塞控制方法在权利要求书中公布了:1.一种基于深度强化学习的空天地网络拥塞控制方法,其特征在于,所述方法包括: 步骤1:空天地网络建模与全局状态空间定义,建立空天地网络的动态行为模型,定义全局状态空间与本地观测; 步骤2:多维度复合奖励函数设计,通过多维度奖励机制引导智能体协作优化拥塞控制; 步骤3:集中训练-分布式执行框架构建,通过集中式训练优化策略参数,进行分布式实时决策; 步骤4:服务速率动态调整与节点队列管理,实时响应流量变化,平衡节点间负载; 步骤1为步骤2的奖励函数设计与步骤3的策略训练提供状态输入基础; 步骤2的复合奖励通过多目标协同驱动步骤3的集中式策略优化; 步骤3通过参数共享将全局优化策略传递至步骤4的分布式执行; 步骤4的动态速率调整与拓扑适配直接依赖步骤3的策略网络输出,并通过MPLS流量协议增强网络鲁棒性,形成从建模、训练、执行到动态适配的闭环控制流程; 具体包括以下步骤: (1)网络建模与状态空间构建:将空天地网络建模为多智能体马尔可夫决策过程MDP,每个节点作为独立智能体,构建全局状态空间,包含各节点归一化队列长度、链路服务速率及流量波动; (2)奖励函数设计:设计复合奖励函数包含方向性奖励、平滑性奖励和队列效率奖励,公式为: 其中,是一个超参数,用作服务速率选择的基线;如果节点的队列剩余容量比邻居节点更多,选择低于的服务速率可减轻下游邻居的压力; ;用来评估端口服务速率的合理性,用于衡量上游路由器的服务速率与下游路由器的队列长度变化之间的关系;表示在时刻所选择的动作带来的队列长度差异越小,奖励就越大;表示保持队列长度较小也能增加奖励; (3)策略优化训练:采用集中训练-分布式执行框架,通过最大化累积奖励函数优化策略网络参数,通过裁剪策略更新比率和优势函数,确保策略更新的稳定性,公式为: 其中为裁剪范围,为确保策略更新稳定性,裁剪范围为; (4)服务速率动态调整:在分布式执行阶段,各节点基于本地观测独立调整节点输出端口服务速率,公式为: 其中由策略网络输出决定。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210000 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。