重庆邮电大学刘焕淋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种多智能体深度Q网络优化室内VLC-RF资源能效分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119255382B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411359483.4,技术领域涉及:H04W72/0453;该发明授权一种多智能体深度Q网络优化室内VLC-RF资源能效分配方法是由刘焕淋;侯杨洋;陈勇;陈科;陈浩楠;谢裕欣设计研发完成,并于2024-09-27向国家知识产权局提交的专利申请。
本一种多智能体深度Q网络优化室内VLC-RF资源能效分配方法在说明书摘要公布了:本发明涉及一种多智能体深度Q网络优化室内VLC‑RF资源能效分配方法,属于光无线通信技术领域。本发明为提高VLC‑RF异构网络的系统能效,将用户抽象为深度Q网络的智能体,用户选择VLC‑RF接入点、功率分配和子载波资源分配抽象为智能体的动作,设计兼顾用户对通信速率联盟满意或对信道可靠性联盟满意的比例公平满意度值和系统能耗利润值的乘积作为深度Q网络的奖励Q值,使用一个可变贪婪因子控制智能体的联盟转换,获得用户侧重的接入AP信道状态;然后,采用深度Q网络为用户选择Q值最大的动作,优化VLC‑RF系统中多个用户关联接入点、接入点发射功率和子载波资源分配。所提方法在增加用户满意度同时,可以提高VLC‑RF的系统能效。
本发明授权一种多智能体深度Q网络优化室内VLC-RF资源能效分配方法在权利要求书中公布了:1.一种多智能体深度Q网络优化室内VLC-RF资源能效分配方法,其特征在于:该方法包括以下步骤: S1:输入用户设备集合M,各用户请求速率值,1个RFAPRadioFrequencyAccessPoint,射频接入点和N个VLCAP保存在APAccessPoint,接入点集合N中,RFAP在集合N中序号为0,AP的子信道集合为K,VLCVisibleLightingCommunication,可见光通信AP的发射功率PV,RFAP的发射功率为PR;设置观测时隙数T,SINR阈值,折扣因子γ,单位通信可达速率的利润值ζ,单位发射功率所需的代价值σ,通信速率需求被系统满足的权重因子κ;分别计算用户设备接入VLCAP和RFAP的信道增益及可实现的可达速率值,计算系统的总可达速率值,t∈T; 其中,根据朗伯辐射模型,在第t时隙,用户m接入VLCAPn的信道增益为: 上式中,代表朗伯辐射系数,且φ12表示VLCAP的半功率辐射角,φ表示VLCAP的辐射角,Ar表示UE的接收机光探测器PhotoDetector,PD的接收面积,表示UEm与APn的直线距离,ψm,n为UEm接收VLCAPn信号时的入射角,ψc为UE接收机的视场角,Tsψm,n和gψm,n分别表示UEm以ψm,n接收光线信号时的光学滤波器和光学聚光器的增益; 其中,由香农公式,用户m接入VLCAPn的子信道k的SINRSignaltoInterferenceplusNoiseRatio,信干噪比值为: 上式中,分别为第n个和第n’个VLCAP在第t时隙连接UEm时分配的第k个子载波光功率值;表示用户m接入VLCAPn′的信道增益值;η为UE的PD光电转换系数;NV,分别是VLC噪声的功率谱密度和VLCAP的第k个子信道的信道带宽,其中,BV为每个VLCAP可通信的总调制带宽,且每个VLCAP的子信道总数为K;N\0表示除RFAP外的所有VLCAP集合,其中,0是RFAP在集合N中索引符号; 其中,在第t时隙,用户m接入VLCAPn的子信道k能获得的可达速率值为: 其中,在第t时隙,第n个VLCAP能实现的可达速率值可以通过下式计算: 上式中,是一个二元变量,如果第m个UE与第n个VLCAP在第t时隙关联使用其第k个子信道,则否则, 其中,在第t时隙,RFAP与第m个UE之间的链路信道增益可以表示为: 上式中,为描述RF小范围衰落的服从指数分布随机变量,其均值为2.46dB;Ldm,0t为RF链路的路径损失函数,其定义式为; 上式中,dm,0t是t时隙内RFAP与第m个UE间的距离;B1,B2分别是增益模型的常量,其取值为35.3和21.3;fc是载波的中心频率,单位为GHz;X是均值为0、方差为1.8dB的高斯随机变量; 其中,在第t时隙,UEm接收RFAP的第k个子载波上信号的SINR值的计算公式为: 上式中,为在时隙t时RFAP分配给连接UEm的第k个子载波的功率值;为RF系统的平均噪声功率; 其中,根据香农公式,在第t时隙,UEm关联RFAP获得的可达速率为: 上式中,为第k个RFAP子信道的带宽; 其中,在第t时隙,RFAP能实现的可达速率的计算公式为: 上式中,是一个二元变量,当用户m在第t时隙关联RFAP的第k个子信道时,否则, 其中,在第t时隙,VLC-RF系统能实现的总可达速率为: S2:根据可达速率值,计算各AP的单位调度周期平均可达速率和平均功耗,构造AP的能耗利润函数;构造评价用户请求接入不同AP的满意度比例公平函数,采用联盟博弈的方法,根据链路状态和满意度需求,采用概率优化方法优化用户的联盟转换,构造反映系统能效和用户满意度的优化目标函数; 具体地,S2的具体步骤为: S201:计算每个AP的历史平均功率消耗值; 其中,AP的平均功率消耗值的功率计算方式为: 上式中,T为一个调度周期的时隙数,为VLCAPn在时隙t的总发射功率,为RFAP在时隙t的发射总功率值,Θ为VLCAP发射功率等效为RFAP发射功率的权值; S202:计算每个AP的历史平均可达速率值; 其中,每个AP的平均可达速率的计算公式为: S203:计算系统中每个AP的平均能效利润值; 其中,AP的平均能效利润值的计算公式为: 上式中,ζ是系统获得单位通信可达速率的利润,σ表示AP的单位发射功率所需的代价; S204:统计用户设备m的高速率需求高速率需求被系统满足的平均概率值; 其中,用户设备m的高速率需求在一轮调度周期T内被VLC-RF系统满足的平均概率为: 上式中,μmt为用户设备m的高速率需求在第t时隙被系统满足的概率,其值为:μmt=pro{Rsert≥Rreqt},pro·为满足括号中条件的概率函数值;Rreqt表示用户m在第t时隙请求的通信速率值,Rsert为用户m在第t时隙内从AP获得可达速率值, S205:统计用户设备m的高可靠性需求被系统满足的平均概率值; 其中,高可靠性需求用连接不中断概率表示,用户设备m的高可靠性需求在调度周期T内被VLC-RF系统满足的平均概率为: 上式中,λmt为用户设备m的高可靠性需求在第t时隙通信的SINR值被满足概率,λmt=pro{γmt≥γth},γth为不中断通信的SINR阈值,γmt为用户m在时隙t的SINR值, S206:为了提高用户的速率需求或可靠经性连接被满足的概率,提高用户的QoSQualityofService,服务质量,将用户设备选择接入哪个VLCAP或RFAP以获得较高的QoS的选择建模为一个联盟博弈,计算联盟博弈的效用函数值;其中,系统初始化建立联盟博弈开始时刻,让所有用户先加入到联盟F1; 其中,用户接入AP的联盟博弈模型为: G=M,V,F 上式中,F为联盟集合,F={F1,F2},其中,F1和F2分别表示高速率联盟用户集合和高可靠联盟用户集合,且F1∪F2=M;V为联盟的效用函数; 其中,联盟F的效用函数VF可以表示为: S207:从集合M中选择一个没有尝试联盟转换的用户,计算联盟转换后的效用函数值,若用户联盟转换后的联盟效用值大于转换前的联盟效用值,转步骤S208;否则,用户尝试的联盟转换无效,联盟F1和F2保持不变,转步骤S209; 其中,用户m从联盟F1换到联盟F2,转换后的联盟效用函数为: S208:对请求联盟转换的用户,随机生成一个概率转换值p,若概率值大于可变贪婪因子值,则将该用户从一个联盟按照概率值p转换到另外一个联盟;否则,该用户以可变贪婪因子值从一个联盟转换到另外一个联盟; 其中,用户m请求联盟转换的可变贪婪因子PLt的计算公式为: 上式中,Lt=log2tL0,其中L0表示的是常数,L0=T,t∈T; S209:若集合M中所有用户都尝试了联盟转换,确定了F1和F2中的用户,转步骤S210;否则,返回步骤S208; S210:计算系统中用户的不同需求被系统满足的比例公平函数值; 其中,用户的不同需求被系统满足的比例公平函数值计算公式为: 上式中,κ为用户的高速率通信需求被系统满足的权重因子,κ∈[0,1],1-κ为用户的可靠性需求被系统满足的权重因子; S211:建立VLC-RF系统的能效-用户满意度最大化的优化目标函数: 其中,VLC-RF系统的能效-用户满意度最大化的优化目标函数为: max{EEP·PF} 上式中,需要在调度周期内,通过调整各用户接入AP的关联性、用户从AP获得的功率值和分配的子载波实现; S3:将VLC-RF接入用户和分配资源用一个马尔可夫决策过程表示,用户抽象为智能体,构造智能体的状态空间、动作空间、状态转移概率矩阵、以及智能体的Q函数值作为智能体根据链路状态信息,决策动作为:用户选择AP接入、AP发射功率和分配AP的子载波资源的状态-动作策略的奖励,所设计的奖励函数为系统优化目标函数;通过DQNDeepQ-LearningNetwork,深度Q学习网络优化马尔可夫决策过程,采用一个可变贪婪因子控制智能体在不同资源分配阶段采用可调整的概率探索策略,优化系统中用户关联VLC-AP接入点、接入点发射功率和子载波资源分配的Q函数值,获得优化的各用户的资源分配方案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励