Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于流量状态预测的队列智能管理方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京信息工程大学

摘要:本发明公开了一种基于流量状态预测的队列智能管理方法,包括:基于GRU算法,进行网络流量状态预测;构建网络状态元组,基于策略神经网络和目标神经网络组成智能体,智能体根据当前时刻的网络状态,基于ε‑greedy策略决策并输出动作;设置奖励函数,智能体根据所采取的动作获得相应的奖励,更新网络状态,组建经验样本;智能体选取经验样本,对策略神经网络和目标神经网络进行训练并更新权重,完成队列的管理;本发明所设计的方法在提高了算法泛化性的同时,通过对网络流量状态的预测,实现了对突发流量的合理控制。

主权项:1.一种基于流量状态预测的队列智能管理方法,其特征在于,针对网络环境中由数据包组成的队列,执行如下步骤S1-步骤S5,完成队列的管理:步骤S1:针对当前时刻的网络环境,根据当前时刻的队列长度Lt,基于GRU算法,经过更新门和重置门两个门控单元的计算,输出预测的下一时刻的队列长度Lt+1,完成网络流量状态预测;步骤S1的具体步骤如下:步骤S1.1:设置更新门zt如下式: ;其中,为更新门的权重矩阵,为上一时刻的隐藏状态,为更新门中上一时刻隐藏状态的权重矩阵,为当前时刻t的队列长度;步骤S1.2:设置重置门Rt如下式: ;其中,为重置门的权重矩阵,为重置门中上一时刻隐藏状态的权重矩阵;步骤S1.3:计算当前时刻的候选隐藏状态如下式: ;其中,为权重矩阵,为偏置向量;步骤S1.4:最终的隐藏状态的计算公式如下式: ;式中,为当前时刻的候选隐藏状态,为上一时刻的隐藏状态,为更新门;步骤S2:以下一时刻的队列长度Lt+1、当前时刻的丢包率Rdeq和队列延迟dt,组成当前时刻的网络状态;步骤S3:基于策略神经网络和目标神经网络组成智能体,智能体监测当前时刻的网络状态St,当队列中存在队列延迟时,智能体根据当前时刻的网络状态St,基于ε-greedy策略决策并输出针对数据包的动作at;步骤S3中的ε-greedy策略如下式: ;式中,at表示针对数据包的动作,x表示随机变量,ε表示衰减参数,表示当前时刻网络状态的Q值函数,由策略神经网络计算,其中,St表示当前时刻网络状态,a表示智能体可执行的动作,θ表示策略神经网络的权重;表示智能体可执行的动作a中使当前时刻网络状态的Q值函数最大的动作;衰减参数ε如下式: ;式中,为ε的初始值,表示ε的最小值,为衰减因子,steps为迭代次数;步骤S4:设置奖励函数,根据智能体所输出的动作at,智能体获得相应的奖励rt,并更新网络状态St+1;基于网络状态St、动作at、奖励rt、网络状态St+1,组成经验样本存储到经验回放池中;步骤S4中设置奖励函数的具体步骤如下:步骤S4.1:设计吞吐量奖励函数;设计时延奖励函数,分别如下式: ; ;其中,为当前周期内的平均网络吞吐量,是上一个周期内的平均网络吞吐量;是期望排队时延,是当前排队时延,通过队列长度和出队速率计算得出;δ和μ是吞吐量奖励函数和时延奖励函数之间的缩放因子;和的计算如下式: ; ;其中,是队列的数据包数量,是丢弃数据包的数量,Lt是当前时刻的队列长度,当为0时,将也设置为0;步骤S4.2:设置clip函数将奖励rt裁剪为对应于-1到1之间的值,表示为下式: ;当时,将奖励rt赋值为-1;当时,奖励rt等于其本身;当时,将奖励rt赋值为1;步骤S5:当经验回放池中的经验样本数量超过预设的最小批量值,智能体从经验回放池中随机选取经验样本,对策略神经网络和目标神经网络进行训练并更新权重,完成队列的管理。

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于流量状态预测的队列智能管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。