一种基于联邦学习的设备选择与资源分配方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆邮电大学

摘要：本发明涉及一种基于联邦学习的高效设备选择与资源分配方法，属于移动通信领域，包括以下步骤：S1：在集中训练阶段开始时，初始化所有边缘智能体的行动者和批评家网络参数，并按照学习步骤进行更新，实例化经验回放池；S2：部署体验重放池，在采样阶段，所有边缘智能体的经验都存储在其中，在训练阶段，每个边缘智能体从经验池中随机抽取一批经验，以非策略的方式对网络参数进行训练；S3：在参数更新阶段，协调边缘智能体，在从所有个体环境中收集的经验与当前代理的策略之间进行交替更新，基于初始经验池中采样的批量经验池中转化多维元组中更新参数；S4：将更新完成的参数用于智能体目标网络更新，并获得全局最佳联合决策。

主权项：1.一种基于联邦学习的设备选择与资源分配方法，其特征在于：在移动边缘计算网络场景中，为降低工业物联网场景下联邦学习的通信开销，利用边缘服务器和云服务器对联邦学习中的设备选择以及链路带宽频谱资源进行最优分配，在每个边缘服务器中均部署有边缘控制器，所述边缘控制器上运行有相应的边缘智能体；在边缘服务器上计算损失值Feωm并传输到云服务器，由云服务器计算平均损耗Fcwm并下发到每个边缘服务器，作为边缘智能体的奖励；获得全局最佳联合决策的具体步骤如下：S1：初始化参数：在集中训练阶段开始时，初始化所有边缘智能体的行动者和批评家网络的参数，并按照学习步骤进行更新，另外，一个经验回放池被实例化；S2：经验抽样：采用基于经验回放技术的off-policy技术，部署一个具有一定内存容量的经验重放池，在采样阶段，所有边缘智能体的经验都存储在其中，在训练阶段，每个边缘智能体从经验池中随机抽取一批经验，以非策略的方式对网络参数进行训练；S3：参数更新：在参数更新阶段，边缘智能体被协调起来，在从所有个体环境中收集的经验与当前代理的策略之间进行交替更新，并且基于初始经验池中采样的批量经验池中转化多维元组中更新参数；S4：将步骤S3中更新完成的参数用于智能体目标网络更新，并获得全局最佳联合决策；对于边缘智能体m，具体更新步骤如下：步骤1通过最小化损失函数Lφm,v来独立更新评价批评家网络的参数v表示优化因子：其中，表示为目标Q值，其中和分别表示所有智能体当前和下一个状态集；m为智能体个数索引，t为迭代轮次索引；log·是返回动作熵值的函数；Υ是返回状态函数最小值函数；和分别是由评价网络和目标评价网络计算的状态-动作Q值；在评价批评家网络和目标批评家网络中分别设置两个参数以缓解政策改进中的正偏置，损耗计算只使用这两个Q值的最小值，从而得到用于更新批评家网络参数的随机梯度：其中，▽表示梯度计算；αm为最大熵目标权值；表示智能体m实时策略；步骤2通过策略梯度方法对行动者网络进行更新，目标函数定义为：其中，策略函数通过FCNN网络重新参数化表示为其中E表示期望函数，其中加入一个高斯噪声εt，从而获得一个较低的方差估计，公式4重新表示为：其中εt服从高斯分布，由此计算出策略的梯度：步骤3采用FCNN来自动设定最大熵目标的权值αm，αm的梯度通过以下目标来计算：其中为所有智能体的决策集合，H′为目标熵的值；采用软更新方法，从评价批评家的参数φm,v中更新目标批评家网络的参数φ′m,v：φ′m,v＝τφm,v+1-τφ′m,v8其中τ∈0,1为更新因子。

全文数据：

权利要求：

百度查询：重庆邮电大学一种基于联邦学习的设备选择与资源分配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可替换物联网服务中心的方法

下一篇：电池片翘曲度测量装置

相关技术

一种可替换物联网服务中心的方法

电池片翘曲度测量装置

离心旋转式钼精粉混合给料机

气味检测系统和气味检测方法

负载优化的大型滚动轴承装置

显示面板及显示面板的制作方法

VEGF结合分子及其医药用途

一种柔性线路板通电性能检测装置

用于运动发酵单胞菌表面展示的蛋白

机器人呼梯控制装置、系统

一种增加LED激发光源利用率的封装结构及封装方法

一种先进在线能源监控与诊断系统

学习相关技术

预测装置、学习装置及学习方法_龟甲万株式会社_202280091168.0

使用周期数据的机器学习_脸萌有限公司_202380020610.5

英语分层学习方法及系统_深圳英卓教育科技有限公司_202410776546.X

一种分数学习盘_福建省诺达轻工股份有限公司_202420254383.4

量化稳健联合机器学习_高通股份有限公司_202380017780.8

信息处理装置、推论装置、机器学习装置、信息处理方法、推论方法及机器学习方法_株式会社荏原制作所_202380019756.8

信息处理装置、推论装置、机器学习装置、信息处理方法、推论方法及机器学习方法_株式会社荏原制作所_202380020814.9

用于整数深度学习原语的动态精度管理_英特尔公司_201810420883.X

基于机器学习的压缩空气泄漏检测_生态植物科技创新有限公司_202410286957.0

基于深度学习的时序点云数据增强方法_华南理工大学_202111666209.8

资源分配相关技术

基于能耗优化的工业物联网边缘设备资源分配方法及系统_北京理工大学前沿技术研究院_202411125345.X

资源额度分配方法、装置、设备及计算机存储介质_财付通支付科技有限公司_202310271283.2

业务资源容量动态分配方法、装置、设备及存储介质_中移动信息技术有限公司_202011422102.4

基于光伏组件的地表资源分配方法、装置、介质及设备_中国电建集团西北勘测设计研究院有限公司_202410579435.X

一种基于业务优先级的通信资源分配方法与系统_东风汽车集团股份有限公司_202410622348.8

感-传-算-控闭环系统中的资源分配的方法及装置_清华大学_202410830391.3

带宽资源分配方法、系统、电子设备及存储介质_中国电信股份有限公司_202410729173.0

一种负荷转供的配电网资源分配方法、系统及介质_国网四川省电力公司成都供电公司_202410917772.5

插座和电源分配单元_联想(北京)有限公司_202323192101.7

流体产品分配装置_阿普塔尔法国简易股份公司_202180032539.3

选择相关技术

资源选择的提前指示_松下电器(美国)知识产权公司_202280087783.4

特征选择方法、装置、设备和介质_中移动信息技术有限公司_201910962985.9

选择天线的方法、装置与系统_赛峰电子与防务公司_202080092741.0

一种机床用高速激光选择焊设备_大连古德威机械有限公司_202323238274.8

网络功能的选择方法和网络功能_维沃移动通信有限公司_202110169381.6

手性化合物的立体选择性技术_波涛生命科学有限公司_202380020485.8

波长选择器及单色仪_华翊博奥(北京)量子科技有限公司_202411146953.9

自动驾驶速度曲线选择方法和系统_合众新能源汽车股份有限公司_202210601820.0

用于选择功能性适体的方法和组合物_奥曼尼提纳米有限公司_201980078757.3

用于HARQ-ACK反馈的选择性捆绑技术_高通股份有限公司_202180031070.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于联邦学习的设备选择与资源分配方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务