浙江大学贺诗波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于深度强化学习的面向任务差异的拥塞控制调度方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121077975B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511604104.8,技术领域涉及:H04L47/127;该发明授权基于深度强化学习的面向任务差异的拥塞控制调度方法及系统是由贺诗波;林李萌;顾超杰;陈积明设计研发完成,并于2025-11-05向国家知识产权局提交的专利申请。
本基于深度强化学习的面向任务差异的拥塞控制调度方法及系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的面向任务差异的拥塞控制调度方法及系统,包括:进行网络拓扑配置;生成应用层任务流;进行网络协议栈运行配置;实现客制化拥塞控制模块;进行数据采集;进行奖励构造;进行强化学习训练;依据不同任务流的调度策略差异设计动作空间,根据各任务对性能指标的关注重点,将拥塞窗口调整映射为动作集合,使得智能体能够针对任务流差异输出相应的调度策略,从而实现面向任务差异的自适应拥塞控制。本发明具备高度可配置性与现实可映射性,所设计的各模块可真实对应于Linux内核中的相关网络功能。系统中收集的数据结构与处理逻辑也基于真实操作系统内核中的实现,因而具备较强的现实可行性。
本发明授权基于深度强化学习的面向任务差异的拥塞控制调度方法及系统在权利要求书中公布了:1.一种基于深度强化学习的面向任务差异的拥塞控制调度方法,其特征在于,包括: 步骤1,进行网络拓扑配置; 步骤2,生成应用层任务流; 步骤3,进行网络协议栈运行配置; 步骤4,实现客制化拥塞控制模块; 步骤5,进行数据采集; 步骤6,进行奖励构造; 步骤7,进行强化学习训练,将采集的状态信息输入至深度Q学习智能体中,结合ε-贪婪策略进行动作选择,利用经验回放机制提升样本利用率,并通过策略网络与目标网络的双网络结构提升训练稳定性; 步骤8,依据不同任务流的调度策略差异设计动作空间,根据各任务对性能指标的关注重点,将拥塞窗口调整映射为动作集合,使得智能体能够针对任务流差异输出相应的调度策略,从而实现面向任务差异的自适应拥塞控制,包括: a.控制命令流动作设计,包括: 动作空间设置:设计小步长、对称的拥塞窗口调整动作,以及保持当前窗口的惰性动作; b.数据上报流动作设计,包括: 动作空间设置:优先提供更多正向动作或指数级增长动作,同时减少负向动作的出现频率; c.大文件更新流动作设计,包括: 动作空间设置:通过测量往返时延延迟梯度感知链路拥塞,并主动让出带宽; 行为特征:网络空闲时积极传输,检测到延迟升高则迅速降低速率; 协同调节策略:引入“协同式调节”机制,使用与数据上报流动作空间对称的衰减动作,即当数据上报流中包含多个增大动作时,大文件更新流对应引入多个“窗口减小”动作; d.视频流动作设计,包括: 动作空间设置:使用一组细粒度拥塞窗口增减动作,每个动作代表微幅调整; 拥塞窗口调整执行,包括: 执行时机:实际调整操作在收到确认信息时进行; 调整依据:根据先前确定的控制策略参数更新拥塞窗口; 强化学习作用:强化学习模块输出的控制指令不直接修改内核窗口值,而作为后续确认反馈处理阶段的调节依据,保证控制过程符合标准传输控制协议工作流程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310000 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励