首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于策略梯度算法和博弈的分布式多维网络资源切片方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东科技大学

摘要:本发明公开了一种基于策略梯度算法和博弈的分布式多维网络资源切片方法,属于移动通信技术领域,包括如下步骤:构建由宏基站和小基站以及两种服务类型的车辆用户组成的异构车联网场景;对用户关联和基站间资源分配问题建模为Stackelberg博弈框架,并采用匹配理论得到稳定的用户关联方案;把分布式多维资源切片建模为随机博弈框架,并采用基于图注意力网络的多智能体双延迟深度确定性策略梯度算法求解随机博弈问题,得到精确的分布式多维网络资源切片策略。本发明将博弈论和策略梯度算法相结合,解决了车联网中用户关联和分布式多维资源分配联合优化问题,在保证基站负载均衡的条件下提高不同服务类型用户的QoE。

主权项:1.一种基于策略梯度算法和博弈的分布式多维网络资源切片方法,其特征在于,包括如下步骤:步骤1、在车联网区域内,构建由宏基站、小基站以及两种服务类型的车辆用户组成的异构车联网模型;步骤2、对车辆用户关联和基站间资源分配问题建模,采用匹配理论和Stackelberg博弈得到稳定的车辆用户关联方案;具体过程为:步骤2.1、考虑使用车辆用户的网络传输速率对车辆用户的效用进行建模;当车辆用户i与基站k相关联时所获得的效用为:Uiwi,k=qlog21+ri,k=qlog21+wi,klog21+SINRi,k1;其中,Ui为车辆用户i与基站k相关联时获得的效用值;wi,k既表示关联变量同时也表示车辆用户i从基站k获得的通信资源,当wi,k=0时表示车辆用户i未与基站k关联,wi,k0时表示车辆用户i从基站k获得的通信资源为为与基站k相关联车辆用户的数量,为基站k根据关联车辆用户的数量从虚拟资源池获得的通信资源;q为车辆用户服务体验质量因子;ri,k为车辆用户i与基站k关联的传输速率;SINRi,k为车辆用户i与基站k之间通信链路的信干噪比;步骤2.2、构建要解决的第一个问题P1,第一个问题是在基站给出通信资源价格策略的前提下如何选择基站k以获得高的效用,即: s.t.C1:ri,k≥Rmin C3:wi,kpk≤Bi2;其中,为车辆用户i的最优关联策略集;Λi为车辆用户i可供选择的关联策略集;为除车辆用户i之外的用户最优关联策略集;Xk为对基站k的资源分配策略;C1表示车辆用户的最小速率限制;Rmin为用户的最小速率限制;C2表示与基站k相关联车辆用户i分得的通信资源等于基站的总资源;Ik为与基站k关联的用户集合;C3表示每个车辆用户获得通信资源的最大预算不得超过Bi;pk为基站k通信资源的价格;Bi为车辆用户i购买通信资源的预算;基站k的收益Rek表示为: 其中,Cost·为基站从虚拟资源池获取通信资源的二次成本函数;ptotal为虚拟资源池中通信资源的价格;为基站引入一个负载因子定义一个负载函数flb来表征基站的拥塞程度: 其中,为基站k的负载阈值;定义基站的效用函数为: 步骤2.3、构建要解决的第二个问题P2,第二个问题是在车辆用户与基站关联后基站如何根据负载选择资源价格策略来使自己的收益最大,即: 其中,为基站k的最优资源分配策略;X-k为除基站k之外的基站资源分配策略;Λ为所有用户的关联策略;C4表示所有基站的负载因子之和为1;C5表示所有基站获得的通信资源之和等于资源池总资源;步骤3、根据不同服务类型的车辆用户的速率和时延阈值形成分布式多维资源分配随机博弈问题,并采用基于图注意力网络的多智能体双延迟深度确定性策略梯度算法进行迭代学习,求解随机博弈问题,得到精确的分布式多维网络资源切片策略。

全文数据:

权利要求:

百度查询: 山东科技大学 基于策略梯度算法和博弈的分布式多维网络资源切片方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。