Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京航空航天大学冯斯梦获国家专利权

恭喜南京航空航天大学冯斯梦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京航空航天大学申请的专利一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117241292B

龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311170683.0,技术领域涉及:H04W24/02;该发明授权一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法是由冯斯梦;李念;赵一迪设计研发完成,并于2023-09-11向国家知识产权局提交的专利申请。

一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法在说明书摘要公布了:本发明公开了一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,包括:计算用户终端与接入点之间的信道增益;利用K均值聚类算法对用户分簇;将接入点与用户关联,构建以用户为中心的小区;在削波失真和功率约束下表述确定调制模式分配与功率分配策略,实现总吞吐量最大化的优化问题;将所述优化问题对应于强化学习问题,利用Q学习算法求解强化学习问题,得到分配策略。本发明可达到的吞吐量和中断概率都比传统的以网络为中心的无线光通信系统优越。

本发明授权一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法在权利要求书中公布了:1.一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,包括:步骤一,针对以用户为中心的无线光通信网络,计算用户终端与接入点之间的信道增益;步骤二,根据用户终端的位置信息,利用K均值聚类算法对用户分簇;步骤三,基于步骤一得到的信道增益以及步骤二得到的用户分簇结果,将接入点与用户关联,构建以用户为中心的小区;步骤四,针对步骤三构建的以用户为中心的小区,在削波失真和功率约束下表述总吞吐量最大化的优化问题,其中总吞吐量最大化依赖于确定调制模式分配与功率分配策略;步骤五,将所述优化问题对应于强化学习问题,利用Q学习算法求解强化学习问题,得到分配策略;步骤四所述在削波失真和功率约束下表述确定调制模式分配与功率分配策略,实现总吞吐量最大化的优化问题,具体包括:1,采用迫零预编码技术减轻小区内的多用户干扰,则第i个非定型小区Ci内的多用户系统模型为:yi=HiGiPixi+τi;其中,为第i个非定型小区Ci信道增益矩阵,Ui表示非定型小区Ci中的用户集合,Ai表示非定型小区Ci中的接入点集合,|Ai|,|Ui|分别为集合Ai与集合Ui中元素的数量;为预编码矩阵;Pi为分配的功率矩阵;为发射信号向量;为接收信号向量;Nawgn表示方差为的加性高斯白噪声;表示方差为的削波失真;Ii,k表示干扰;2,直流偏置光正交频分复用中单个发光二极管产生的削波失真的方差: 其中,Pled表示每个发光二极管的电功率;F=Qλb-Qλt为衰减因子,Q·表示高斯Q函数;εb=Pl-Pbias,εt=Ph-Pbias,Pbias为直流偏置,Pl,Ph为线性功率下限、上限;φx=exp-x222π;3,所述优化问题为:根据发射功率限制,计算实际调制模式下可达到的吞吐量的最大值: 其中,q为接入点;表示第i个小区中用户k被分配调制模式m时所需的功率;表示信干噪比,erfc-1表示互补误差函数的反函数,BER表示误码率;GB表示带宽利用率;表示加性高斯白噪声,N0是功率谱密度;表示直流偏置的衰减,[Gi]q,k表示位于预编码矩阵Gi中第q行第k列的元素;表示小区i中的用户k收到的来自其他小区的干扰,C表示存储的步骤三中所构建的以用户为中心的小区的集合,[Hl]k,q表示小区l的信道增益矩阵Hl中位于第k行第q列的元素,表示最大发射功率限制;xi,k,m=1表示用户k被分配调制模式m,xi,k,m=0表示用户k没有被分配调制模式m;如果对于用户k,说明该用户没有分配任何调制模式;考虑DCO-OFDM,实际调制模式下可达到的吞吐量: 其中,ri,k,m表示第i个小区中的用户k在调制模式m下可达到的速率;m∈M,M表示调制模式集,包含|M|个调制模式;表示信息承载带宽;步骤五所述将优化问题对应于强化学习问题,具体包括:无线光通信系统对应于环境;用户对应于智能体;每一级功率约束对应于一个状态,将最大发射功率限制离散化为J个级别:调制模式分配对应于智能体采取的动作,可达到的吞吐量对应于智能体获取的奖励;所述步骤五采用Q学习算法求解强化学习问题,不断训练Q表格直到Q表格收敛,并利用训练好的Q表格,选取最优分配策略,使系统吞吐量最大化;在整个训练过程中,用户选择动作以及更新策略;并使用ε-贪心策略选择动作,即决策时有ε的概率随机选择动作,1-ε的概率按照Q函数选择;Q表格里的值初始化为0,通过策略更新函数不断更新Q值,以获得最大的长期累积奖励: 其中,a为状态s下的动作,0α≤1为学习率,表示更新速率;r为奖赏值;0≤γ≤1为折扣因子;a′为下一状态s′的最优动作。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:211106 江苏省南京市江宁区将军大道29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。