基于深度确定性策略梯度算法的卫星互联网资源调度方法

导航：龙图腾网> 最新专利技术> 基于深度确定性策略梯度算法的卫星互联网资源调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及一种基于深度确定性策略梯度算法的卫星互联网资源调度方法，该方法首先提出了一种基于TEG的星上SFC分流机制。其次，在TEG分流模式下，建立了流量守恒约束，并结合资源容量约束和流速非负性约束，构建了SFC的最小流速率最大化模型。然后，由于流量工程问题属于连续动作，因此采用基于DDPG的SFC流量工程方法对该问题进行求解。仿真结果表明，TEG分流机制可以有效提升最小流速率，并且与基准方法比较，所提方法的性能更优，且收敛速度优于基准方法。

主权项：1.一种基于深度确定性策略梯度算法的卫星互联网资源调度方法，其特征在于：包括如下步骤：S1：建模一个多卫星节点多服务功能链SFC的卫星网络SDSN，令SDSN表示为有向图GV，E，其中V是节点的集合，E是链路的集合，E包括物理链路集Evv和卫星在相邻时隙之间的储存链路集Ev；时间演化图TEG将总时间划分为T个时间间隙，每个时隙的长度为η，令t∈T表示为时隙的索引，在TEG中，用it，jt∈Evv表示两颗不同卫星之间的物理链路，用it，it+1∈Ev表示同一颗卫星的连续时隙之间的存储链路；令K＝{1，2，...，k，...}表示SDSN中的SFC请求集合，对于k∈K，表示VNFs的有序集合，表示第k个SFC的第n个VNF；最后一个VNF表示为m表示VNFs的个数；和分别表示第k个SFC的源节点和目的节点；S2：假设在同一个时隙内，只能部署在一个卫星节点上，将VNF部署约束建模为：其中it表示卫星节点i在第t个时隙的副本，为VNF部署指示变量，表示第个VNF部署的位置为节点it，反之则表示第个VNF部署的位置不在节点it上；定义yk为第k个SFC的流量速率，定义变量为第k个SFC在链路it，jd∈E的流量速率，其中，表示第k个SFC在链路it，jt∈Evv的流量速率，表示第k个SFC在链路it，it+1∈Ev的流量速率；流量速率表示为：其中表示第k个SFC在通过第个VNF后，链路it，jd∈E的流量速率，表示一个位于源节点上的辅助VNF，标识尚未经过任何VNF处理的SFC流；S3：卫星节点的计算资源约束建模为：其中表示在链路jd，it上通过第个VNF处理后的流量速率，表示节点it的计算资源容量；表示单位数据流速的计算资源需求；此外，链路的带宽资源容量表示为：其中表示链路it，jt的带宽资源容量，表示第k个SFC在链路it，jt∈Evv的流量速率；S4：分情况构建关于TEG分流模型的流守恒约束条件；S5：设置最大化所有SFC的最小流速率ymin为优化目标：对SFC的流量速率以及每个SFC各个阶段的流量速率施加非负性约束，并建模为：yk≥0 S6：将SDSN网络的控制器作为对SFC部署进行集中控制的智能体，将优化问题建模为适用于深度强化学习求解的MDP模型，定义状态空间、动作空间及奖励函数；S7：基于DDPG模型求解S6构建的MDP模型，得到最优SFC部署；所述DDPG方法包括Actor网络、Critic网络以及经验回放池，Actor网络的当前网络πs及其目标网络π′s的参数分别为θπ和θπ′，Critic网络的当前网络Qs，a及其目标网络Q′s，a的参数分别为θQ和θQ，Actor网络负责动作筛选以及策略制定，并分别根据策略梯度上升和损失函数的梯度下降更新Actor网络和Critic网络参数，Critic网络负责对生成的策略进行评估，经验回放池用来储存状态st，动作at，rt和下一个状态st+1构成的经验元组；初始化Actor网络和Critic网络的参数以及经验回放池，在每一轮迭代中更新Actor网络和Critic网络的参数；向DDPG方法输入st，从Actor网络中得到at，将at应用到st中，SDSN控制器进行SFC部署，此时得到rt并更新st+1，将st，at，rt，st+1作为一个经验元组保存到经验回放池中，当经验回放池填满后，最早的经验元组将会被新的经验元组替代；从经验回放池中随机选取小批量经验元组进行训练，在最大化期望累计折扣奖励的目标下，通过梯度求解进行Actor网络和Critic网络的参数更新，期望累计折扣奖励是指在策略执行过程中，从当前状态开始，未来所有可能得到的奖励之和的期望值；状态-动作值函数Qπst，at用来估计给定状态和动作下的期望累计折扣奖励；通过Actor网络和Critic网络的参数更新指导SDSN控制器在下一轮迭代中更好地进行SFC部署，直到训练轮次到达设定的最大值，优化任务的期望累计折扣奖励最大化，表示训练结束，并得到最优SFC部署。

全文数据：

权利要求：

百度查询：重庆大学基于深度确定性策略梯度算法的卫星互联网资源调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种角度测量方法、装置和系统

下一篇：一种贝壳破裂纹高效破裂装置及贝壳加工系统

相关技术

一种角度测量方法、装置和系统

一种贝壳破裂纹高效破裂装置及贝壳加工系统

一种获取延时预留比的方法、电子设备及存储介质

一种多类型丢失数据恢复模型构建方法及系统

基于GPT的加弹机数字孪生机理模型构建方法及系统

网格网络的资源竞争和冲突解决方法、装置和存储介质

具有抗腐蚀钝化膜的Fe-Cr-Si合金及制备方法

一种基于PLC的安检输送线

高压环路互锁系统、控制方法及电动汽车

一种基于多层环保袋生产线的码垛机械手

一种二胺、聚酰胺酸、聚酰亚胺、液晶取向剂及液晶取向膜

一种矿用随车吊吊臂及操作方法

算法相关技术

一种风切变识别算法_中国民用航空西北地区空中交通管理局宁夏分局_202411137591.7

基于国密算法的身份认证系统及方法_广州信子科技有限公司_202411019673.1

基于ECharts组件的关系图弹窗轮播逻辑算法_威创软件南京有限公司_202411248735.6

基于区块链的机组组合可信优化算法_上海交通大学_202411155383.X

基于国密算法的通信加密方法_未来基因(北京)人工智能研究院有限公司_202411069572.5

基于最优化算法的检测框去抖动方法_北京比特易湃信息技术有限公司_202111433743.4

一种基于梯度神经树算法的贷款审批系统及方法_北银金融科技有限责任公司_202411289329.4

基于智能算法的储能变流器优化控制方法及系统_南京亚派科技股份有限公司_202411125763.9

基于双激光头的增材制造路径规划算法_大连理工大学_202110838963.9

一种基于脉冲成型调制实现的PAPR抑制算法_北京理工大学_202410979820.3

卫星相关技术

热刀解锁机构及卫星_中国科学院微小卫星创新研究院_202411344037.6

卫星通信导航电路、方法和电子设备_荣耀终端有限公司_202310665152.2

一种卫星终端应急广播方法_福建新大陆通信科技股份有限公司_202111515226.1

卫星定位方法、装置、设备及存储介质_展讯通信(上海)有限公司_202411331553.5

一种车载防水高精度卫星定位天线_深圳市红心科技电子有限公司_202420693221.0

卫星遥感数据处理系统及其方法_德清宏强测绘地理信息技术有限公司_202311203468.6

一种卫星电箱排线装置_百灵航天科技(江苏)有限公司_202411296854.9

基于北斗卫星的车辆管理方法及系统_深圳市中康北斗科技有限公司_202411513369.2

卫星覆盖区域的预测方法、装置、设备及介质_哈尔滨工业大学_202411153952.7

卫星通信的通信验证方法及相关设备_深圳市乐凡信息科技有限公司_202411123441.0

梯度相关技术

多功能梯度耐火材料的制备设备_武安市富远耐火材料有限公司_202411078737.5

一种具有梯度成分比例的合金空心微点阵材料的制备方法_东北林业大学_202411209217.3

制备多层级梯度泡沫铝的成型模具设备及生产系统_中国核电工程有限公司_202411196369.4

基于深度确定性策略梯度算法的卫星互联网资源调度方法_重庆大学_202411089778.4

梯度下降树的生成方法、装置、电子设备及存储介质_北京百度网讯科技有限公司_202010561789.3

一种基于LSTM浓度梯度时序预测辅助的电子鼻导航方法_东南大学_202411203121.6

一种基于梯度神经树算法的贷款审批系统及方法_北银金融科技有限责任公司_202411289329.4

一种基于梯度提升决策树算法的应急物资库存测算方法_国网山西省电力公司晋中供电公司_202411249913.7

一种梯度复合材料及其制备方法_陕西豪特创新材料有限公司_202411145871.2

一种梯度湿式氧化处理三氯蔗糖废水的工艺_盐城师范学院_202411404014.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度确定性策略梯度算法的卫星互联网资源调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务