一种基于深度强化学习的基站休眠和功率分配方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华东交通大学

摘要：本发明提供一种基于深度强化学习的基站休眠和功率分配方法，本发明以频谱效率和能量效率为优化目标，建立能耗优化模型，并将能耗优化模型的求解问提拆分为两个子问题，分别为基站休眠决策问题和功率分配决策问题，并确定基站休眠决策问题的优化目标和约束条件，以及功率分配决策问题的优化目标和约束条件，然后使用两个深度强化学习网络分别对基站休眠决策问题和功率分配决策问题进行求解，本发明能够解决现有技术忽略了用户在现实世界中的速率要求，数据集的偏差可能导致结果与实际情况大相径庭的问题。

主权项：1.一种基于深度强化学习的基站休眠和功率分配方法，其特征在于，包括：步骤S1，建立由多个重叠覆盖的基站组成、且使用正交频分复用技术的超密集网络场景，在超密集网络场景中建立超密集网络多基站部署的系统模型；步骤S2，根据建立的系统模型，以频谱效率和能量效率为优化目标，建立能耗优化模型；步骤S3，将能耗优化模型的求解问题拆分为两个子问题，分别为基站休眠决策问题和功率分配决策问题，并确定基站休眠决策问题的优化目标和约束条件，以及功率分配决策问题的优化目标和约束条件；步骤S4，基于基站休眠决策问题的优化目标和约束条件，使用第一深度强化学习网络，并设置第一状态空间、第一动作空间与第一奖励函数，对基站休眠决策问题进行求解，得到基站休眠决策；基于功率分配决策问题的优化目标和约束条件，使用第二深度强化学习网络，并设置第二状态空间、第二动作空间与第二奖励函数，对功率分配决策问题进行求解，得到功率分配决策；步骤S1中，在所述系统模型中，存在M个用户均匀分布在超密集网络场景中，基站总数为N，每个基站为其覆盖范围内的用户提供服务，将系统模型的总带宽Btotal分为K个子正交信道，同时将总时间划分为T个时隙，只考虑基站与用户之间的下行链路通信，用表示在第t时隙时第i个基站和第j个用户之间的连接状态，其中，；；；若第i个基站和第j个用户之间已经建立连接，则=1；若第i个基站和第j个用户之间未建立连接，则=0；所述系统模型满足条件式：；步骤S2中，频谱效率的表达式为：；其中，表示系统模型的总吞吐量，表示系统模型的总带宽，表示在第t个时隙时第i个基站的状态，表示在第t个时隙时第i个基站向在第l个信道上的第j个用户提供的传输速率，K表示信道总数；步骤S2中，能量效率的表达式为：；其中，表示系统模型的总能耗，和分别表示基站在活跃和关闭状态下的功耗；表示在第t个时隙时是否将第l个信道分配给与第i个基站相连的第j个用户的状态值，当=1时，表示在第t个时隙时将第l个信道分配给与第i个基站相连的第j个用户，当=0时，表示在第t个时隙时未将第l个信道分配给与第i个基站相连的第j个用户；表示在第t个时隙时第i个基站向在第l个信道上的第j个用户传输的功率；步骤S3中：基站休眠决策问题的优化目标为最大化能量效率；基站休眠决策问题的约束条件为：；；；其中，表示在第t个时隙时与第i个基站相关联的用户总数，表示基站的最大负载量，表示与第j个用户相连的第i个基站的最小传输速率；功率分配决策问题的优化目标为最大化能量效率和频谱效率；功率分配决策问题的约束条件为：；；；；；；其中，表示与第j个用户相连的第i个基站的最大传输功率；步骤S4中：第一状态空间中存在第一状态集合，，其中，是第i个基站的活动和休眠状态，是第i个基站覆盖范围内的用户负载，是第i个基站覆盖范围内的传输速率之和，是第i个基站覆盖范围内的能耗之和；第一动作空间中存在第一动作集合，；第一奖励函数的长期奖励值的表达式为：；其中，表示衰减因子，表示基站在下执行后所获得的即时奖励；第二状态空间中存在第二状态集合，，其中，是第i个基站的传输功率等级，是第i个基站与在第l个信道上的第j个用户的信噪比，是当前的任务负载，是剩余的任务传输时间；第二动作空间中存在第二动作集合，；第二奖励函数的长期奖励值的表达式为：；其中，表示基站在下执行后所获得的即时奖励。

全文数据：

权利要求：

百度查询：华东交通大学一种基于深度强化学习的基站休眠和功率分配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种保护装置

下一篇：一种髋臼盂唇切除器

相关技术

一种保护装置

一种髋臼盂唇切除器

一种生产吸塑包装的快速脱模装置

一种椰子果肉洗涤装置

一种防爆应急疏散指示灯

一种无印记的袋布结构

一种快拆汽车水泵叶轮

一种改性塑料生产用循环冷却装置

一种水性涂料辊涂生产线毛刷辊自动清洗装置

一种余热锅炉用出灰刮板

一种用于半导体芯片制造的镀膜机

筑路机

基站相关技术

通信系统及基站_三菱电机株式会社_202380019948.9

无线通讯定位基站_重庆安研科技股份有限公司_202323574049.1

用户装置及基站装置_株式会社NTT都科摩_201980087662.8

一种基站侧PHR优化方法、存储介质、电子装置和基站_西安抱朴通信科技有限公司_202110875405.X

一种通信基站防尘装置_上海国动网络通信有限公司_202210920540.6

一种多频基站天线_朱嘉诚_202410996492.8

清洁基站及其水箱对接模块_杭州萤石软件有限公司_202322816779.1

一种基于水上用5G基站_北京新润通科技有限公司_202410880433.4

基站应急供电措施稽核方法、装置、设备及介质_中国联合网络通信集团有限公司_202410749348.4

一种预制式5G通信基站_星地通网络(四川)有限公司_202420298801.X

休眠相关技术

一种基于深度强化学习的基站休眠和功率分配方法_华东交通大学_202411008726.X

休眠辅小区定位信号_高通股份有限公司_202180010887.0

车载系统休眠唤醒的系统及方法_诺博汽车科技南京有限公司_202310296336.6

一种长期储存蔬菜的低温休眠舱_徐州冻方鲜科技有限公司_202310299490.9

mTRP中在C-DRX活动时间内的TRP休眠指示_高通股份有限公司_202380019625.X

一种用于无蜂窝大规模MIMO系统的智能高能效AP休眠方法_东南大学_202410776224.5

图像形成装置及其休眠控制方法_珠海奔图电子有限公司_202110940728.2

电子控制单元的休眠方法、装置、设备、存储介质和车辆_北京罗克维尔斯科技有限公司_202310271863.1

一种解除果树种子休眠的种子处理方法_江西省于都县鲜可农产品有限公司_202410691044.7

AIL6基因在增强种子休眠期中的应用_西北农林科技大学_202211372467.X

学习相关技术

机器学习装置以及机器学习方法_株式会社捷太格特_202010146838.7

结合迁移学习的对抗元学习防御方法_西安电子科技大学_202410710485.7

基于多模态深度学习驱动的零次学习智能预警方法_杭州梯度安全服务有限公司_202410884014.8

基于深度学习的document AI系统_优顶特技术有限公司_202410922217.1

一种静音学习屋_广东单词妈妈智能技术有限公司_202420048380.5

一种学习桌_浙江荣达智能家居有限公司_202322988277.7

设备上机器学习模型的测试_皇家飞利浦有限公司_202280091969.7

少儿英语趣味学习教具_翟莺淼_202323595347.9

机器学习辅助的波束选择_苹果公司_202280091228.9

学习用数据集的生成方法、机器学习模型、图像处理装置、学习用数据集生成装置、机器学习装置、图像诊断系统及程序_柯尼卡美能达株式会社_202410338403.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度强化学习的基站休眠和功率分配方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务