一种基于策略网络强化学习的多类型服务资源编排方法

导航：龙图腾网> 最新专利技术> 一种基于策略网络强化学习的多类型服务资源编排方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆邮电大学

摘要：本发明公开了一种基于策略网络强化学习的多类型服务资源编排方法，属于通信技术领域，包括以下主要步骤：步骤1：映射业务首节点；步骤2：将特征矩阵输入强化学习模型中；步骤3：输出候选动作概率；步骤4：选择最大概率动作映射；步骤5：将业务需要映射的下一节点和与上一节点之间的直连链路作为一个元组同时映射，重复步骤2‑4，直至业务全部节点均已映射，判断业务是否映射完成；步骤6：若业务映射完成，计算收益成本比；否则映射剩余链路，重复步骤2‑4直至业务映射完成，计算收益成本比；步骤7：计算损失函数损失值，策略梯度法更新强化学习模型参数。本方法可以提高平均节点服务资源利用率，同时降低业务阻塞率，减少服务提供商成本消耗。

主权项：1.一种基于策略网络强化学习的多类型服务资源编排方法，其特征在于，包括以下步骤：步骤1：映射业务请求Gr首节点；步骤2：将物理网络节点特征矩阵节点-路径特征矩阵路径特征矩阵输入强化学习模型PNRL-Model中；所述物理网络包含物理节点和链路的物理网络拓扑，其中物理节点属性包括节点资源类型、节点剩余资源量、节点度、相邻链路剩余带宽和、平均距离；所述节点剩余资源量为物理网络节点当前可用的资源量，即节点总资源量减去被已经映射的业务占用的资源量；所述节点度如下式：所述相邻链路剩余带宽和，如下式：目的节点到已被业务请求中虚拟节点映射的物理网络节点之间的平均距离，如下式：表示二进制决策变量，如果将第r个业务请求中的虚拟节点ir映射到物理网络节点is，值为1，否则为0；物理链路属性包括带宽剩余量和丢包率；物理网络路径属性包括带宽剩余量、带宽剩余率、跳数和丢包率，所述带宽剩余量，如下式：带宽剩余率，如下式：表示二进制决策变量，如果物理网络源节点as到目的节点bs的第k条物理路径包含物理链路js，值为1，否则为0；丢包率如下式：节点特征矩阵，包含节点剩余资源量、相邻链路剩余带宽和、节点度和候选节点到已映射节点的平均距离，如下式：节点-路径特征矩阵包含目的节点剩余资源量、相邻链路剩余带宽和、节点度、候选节点到已映射节点的平均距离，源节点到目的节点之间路径的可用带宽、带宽剩余率、跳数和最大丢包率，如下式：路径特征矩阵包含源节点到目的节点之间路径的可用带宽、带宽剩余率、跳数和最大丢包率，如下式：上式中，R表示业务请求的集合，Vr表示业务请求Gr的虚拟节点集合，Er表示业务请求Gr的虚拟链路集合，T表示物理网络中所有节点的资源类型，和分别表示业务请求Gr中虚拟链路jr的带宽需求和容忍丢包率，其中Vs表示节点集合；Es表示链路集合；表示物理网络节点is第t种类型的剩余资源量，其中和分别表示物理网络中链路js的带宽总量和带宽剩余量，其中分别表示路径的剩余带宽、带宽剩余率、丢包率和跳数，Psas,bs表示物理网络源节点as到目的节点bs的无环路径集合，K＝|Psas,bs|，其中bs∈Vs,as≠bs；分别表示物理网络节点is的相邻链路集合、相邻链路剩余带宽和和节点度，其中表示业务请求Gr的请求节点i'r在物理网络Gs中的候选节点集合，且SPas,bs表示物理网络源节点as到目的节点bs之间最短路径的跳数；表示物理网络目的节点bs到已被业务Gr中虚拟节点映射的物理网络节点之间的平均距离；业务请求的收益成本比为映射成功业务的节点请求资源量和链路请求带宽之和比映射成功业务节点占用资源量和链路占用带宽之和；优化目标是最大化请求的收益成本比；约束条件有：1节点资源约束：业务请求的虚拟节点映射到的物理网络节点对应资源类型的剩余资源量必须大于对应资源类型的请求资源量；2节点一对一映射约束：同一业务请求内不同的请求节点不可映射到同一物理网络节点上；3带宽约束：业务请求链路映射到的物理网络路径剩余带宽必须大于请求带宽；4丢包率约束：业务请求链路映射到的物理网络路径的最大丢包率必须小于对应请求链路的容忍丢包率；所述强化学习模型PNRL-Model：包含输入层、卷积层、Softmax层、过滤层和输出层；步骤2.1：将物理网络节点特征矩阵节点-路径特征矩阵路径特征矩阵输入到强化学习模型PNRL-Model的输入层，使用离差标准化方法进行归一化；步骤:2.2：将归一化后的节点特征矩阵IN归一化后的节点-路径特征矩阵INP归一化后的路径特征矩阵IP输入策略网络卷积层，生成每个动作的可用资源向量CNCNPCP；步骤2.3：将所有动作的可用资源向量CNCNPCP输入Softmax层，将每个动作的可用资源向量转化成每个动作被选择的概率步骤2.4：过滤掉不满足节点资源约束、一对一约束、带宽约束和丢包率约束的动作；步骤2.5：将不满足约束动作的概率记为0；步骤2.6：输出候选动作以及相对应的候选节点概率PN候选节点路径元组概率PNP候选路径概率PP；所述卷积层的作用是将归一化后的特征矩阵ININPIP执行卷积运算，ωNωNPωP为卷积核权重向量，bNbNPbP为偏置项；对归一化后的节点特征矩阵IN进行卷积操作：对归一化后的节点-路径特征矩阵INP进行卷积操作：对归一化后的路径特征矩阵IP进行卷积操作：将节点可用资源向量转化成每个候选节点被选择的概率：其中g表示向量CN中元素的索引，代表第几个元素，表示向量CN中第g个元素cN,g的指数次方；将节点路径元组可用资源向量转化成每个候选节点路径元组被选择的概率：表示向量CNP中第g个元素cNP,g的指数次方；将路径可用资源向量转化成每条候选路径被选择的概率：表示向量CP中第g个元素cP,g的指数次方；所述强化学习模型PNRL-Model的奖励函数为业务的收益成本比；强化学习模型PNRL-Model的损失函数为： Loss3＝-logmaxpP,1,pP,2,…,pP,KLoss＝Loss1+Loss2+Loss3；步骤3：强化学习模型PNRL-Model输出候选节点概率PN候选节点路径元组概率PNP候选路径概率PP；步骤4：选择最大概率的动作进行映射，并更新物理网络Gs；步骤5：将业务请求需要映射的下一节点i+1r和与上一节点ir之间的直连链路jr作为一个元组同时映射，重复步骤2到步骤4，直至业务请求所有节点映射完成，并判断业务请求Gr是否映射完成；步骤6：若业务请求Gr映射完成，计算业务的收益成本比；否则映射剩余链路，重复步骤2到步骤4直至业务请求Gr映射完成，计算业务的收益成本比；步骤7：计算损失函数损失值Loss，使用策略梯度方法更新强化学习模型PNRL-Model的参数。

全文数据：

权利要求：

百度查询：重庆邮电大学一种基于策略网络强化学习的多类型服务资源编排方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于密钥管理的方法、装置、设备和存储介质

下一篇：一株动物双歧杆菌乳亚种Bbm-19及其调节神经递质的应用

相关技术

用于密钥管理的方法、装置、设备和存储介质

一株动物双歧杆菌乳亚种Bbm-19及其调节神经递质的应用

伽玛参考电压发生电路、伽玛参考电压发生方法及芯片

一种毛刷滚筒及配置该毛刷滚筒的洗地机

半导体器件及其制备方法

一种网球训练测试装置和测试方法

一种防爆型两位三通空气电磁阀

一种基于辐射成像的图像处理方法、系统和存储介质

一种熔断器及熔断器生产方法

一种高效不锈钢拉丝设备及拉丝工艺

一种融合多种加密的超级U盘安全登录互联网云盘方法

小功率盘柜报警灭火系统

类型相关技术

存储类型变更方法、相关装置和介质_腾讯科技(深圳)有限公司_202411253382.9

一种卫星信号的星座类型识别方法、装置及终端设备_广东工业大学_202410804168.1

网络地址转换类型的确定方法、装置及电子设备_书行科技(北京)有限公司_202410968280.9

岩土类型信息处理方法、装置、电子设备和介质_中国地震局地球物理研究所_202410735372.2

一种全类型大气波导激光雷达探测系统及方法_万合(洛阳)光电技术有限公司_202110762610.5

一种高性能的网关NAT类型鉴别方法_王博靖_202411056083.6

基于分析SIP网络协议获取预定类型电话的方法和系统_梁志超_202410749539.0

一种多种类型发电机构建的孤立电网控制系统及控制方法_中车资阳机车有限公司_202410817884.3

一种多类型风机的风电场一次调频场级控制方法及装置_江苏方天电力技术有限公司_202411010227.4

一种融合开放地理数据的多尺度景观功能主体类型识别方法_中国科学院地理科学与资源研究所_202311776841.7

学习相关技术

技能学习方法、作业方法、技能学习装置及相关设备_季华实验室_202411065089.X

利用训练元数据的联合学习_高通股份有限公司_202380023725.X

基于STEM教育的交互学习系统及方法_上海叁深智能科技有限公司_202410837533.9

一种基于深度学习的睡眠分期方法_北京思利普科技有限公司_202410875978.6

基于深度学习的海洋肽活性预测方法_山东理工大学_202411236917.1

面向机器学习的外科手术视频分析系统_威博外科公司_201880001594.4

带有迁移学习ESN模型的瓦斯浓度预测方法_西安重装智慧矿山工程技术有限公司_202410942870.4

一种英语专业辅助学习装置_杨艳艳_202420597110.X

基于深度学习的自动签名方法及装置_安徽省交通规划设计研究总院股份有限公司_202411216061.1

一种联邦学习的聚合验证方法_启明星辰信息技术集团股份有限公司_202210329985.7

服务相关技术

服务器_本田技研工业株式会社_202010208026.0

医疗服务推车_南京市大厂医院_202323656512.7

液冷服务器装置_苏州元脑智能科技有限公司_202410813388.0

流媒体服务器的确定方法、装置、服务器、平台及介质_中国联合网络通信集团有限公司_202411161885.3

一种基于信创服务的智能检测认证综合服务平台_联通数字科技有限公司_202410727022.1

面向服务的车云融合中间件、服务部署方法和设备_上海复运智能科技有限公司_202410825439.1

对象存储服务端的数据认证处理方法、服务器、电子设备_阿里云计算有限公司_202410982746.0

基于生态服务流的城市群地区洪水调节服务评估方法及系统_中国科学院生态环境研究中心_202410887327.9

一种通用服务器的驱动方法和通用服务器_中国长城科技集团股份有限公司_202210138828.8

一种服务器风扇控制系统与服务器_苏州元脑智能科技有限公司_202411120198.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于策略网络强化学习的多类型服务资源编排方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务