基于策略梯度算法和博弈的分布式多维网络资源切片方法

导航：龙图腾网> 最新专利技术> 基于策略梯度算法和博弈的分布式多维网络资源切片方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东科技大学

摘要：本发明公开了一种基于策略梯度算法和博弈的分布式多维网络资源切片方法，属于移动通信技术领域，包括如下步骤：构建由宏基站和小基站以及两种服务类型的车辆用户组成的异构车联网场景；对用户关联和基站间资源分配问题建模为Stackelberg博弈框架，并采用匹配理论得到稳定的用户关联方案；把分布式多维资源切片建模为随机博弈框架，并采用基于图注意力网络的多智能体双延迟深度确定性策略梯度算法求解随机博弈问题，得到精确的分布式多维网络资源切片策略。本发明将博弈论和策略梯度算法相结合，解决了车联网中用户关联和分布式多维资源分配联合优化问题，在保证基站负载均衡的条件下提高不同服务类型用户的QoE。

主权项：1.一种基于策略梯度算法和博弈的分布式多维网络资源切片方法，其特征在于，包括如下步骤：步骤1、在车联网区域内，构建由宏基站、小基站以及两种服务类型的车辆用户组成的异构车联网模型；步骤2、对车辆用户关联和基站间资源分配问题建模，采用匹配理论和Stackelberg博弈得到稳定的车辆用户关联方案；具体过程为：步骤2.1、考虑使用车辆用户的网络传输速率对车辆用户的效用进行建模；当车辆用户i与基站k相关联时所获得的效用为：Uiwi,k＝qlog21+ri,k＝qlog21+wi,klog21+SINRi,k1；其中，Ui为车辆用户i与基站k相关联时获得的效用值；wi,k既表示关联变量同时也表示车辆用户i从基站k获得的通信资源，当wi,k＝0时表示车辆用户i未与基站k关联，wi,k0时表示车辆用户i从基站k获得的通信资源为为与基站k相关联车辆用户的数量，为基站k根据关联车辆用户的数量从虚拟资源池获得的通信资源；q为车辆用户服务体验质量因子；ri,k为车辆用户i与基站k关联的传输速率；SINRi,k为车辆用户i与基站k之间通信链路的信干噪比；步骤2.2、构建要解决的第一个问题P1，第一个问题是在基站给出通信资源价格策略的前提下如何选择基站k以获得高的效用，即： s.t.C1：ri，k≥Rmin C3:wi，kpk≤Bi2；其中，为车辆用户i的最优关联策略集；Λi为车辆用户i可供选择的关联策略集；为除车辆用户i之外的用户最优关联策略集；Xk为对基站k的资源分配策略；C1表示车辆用户的最小速率限制；Rmin为用户的最小速率限制；C2表示与基站k相关联车辆用户i分得的通信资源等于基站的总资源；Ik为与基站k关联的用户集合；C3表示每个车辆用户获得通信资源的最大预算不得超过Bi；pk为基站k通信资源的价格；Bi为车辆用户i购买通信资源的预算；基站k的收益Rek表示为：其中，Cost·为基站从虚拟资源池获取通信资源的二次成本函数；ptotal为虚拟资源池中通信资源的价格；为基站引入一个负载因子定义一个负载函数flb来表征基站的拥塞程度：其中，为基站k的负载阈值；定义基站的效用函数为：步骤2.3、构建要解决的第二个问题P2，第二个问题是在车辆用户与基站关联后基站如何根据负载选择资源价格策略来使自己的收益最大，即：其中，为基站k的最优资源分配策略；X-k为除基站k之外的基站资源分配策略；Λ为所有用户的关联策略；C4表示所有基站的负载因子之和为1；C5表示所有基站获得的通信资源之和等于资源池总资源；步骤3、根据不同服务类型的车辆用户的速率和时延阈值形成分布式多维资源分配随机博弈问题，并采用基于图注意力网络的多智能体双延迟深度确定性策略梯度算法进行迭代学习，求解随机博弈问题，得到精确的分布式多维网络资源切片策略。

全文数据：

权利要求：

百度查询：山东科技大学基于策略梯度算法和博弈的分布式多维网络资源切片方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种互联网服务器接线固定装置

下一篇：用户满意度预测方法、装置、电子设备及存储介质

相关技术

一种互联网服务器接线固定装置

用户满意度预测方法、装置、电子设备及存储介质

一种集成立体库

自动适配开关实现低压直流无线智能灯配解网触发的系统、方法、装置、处理器及存储介质

电极组件、以及包括该电极组件的二次电池、电池组和交通工具

含氟聚合物、导电浆料、正极极片、二次电池、用电装置

一种电子束辐照改善MOF基固态聚合物电解质结构和性能的方法

数据传输控制方法、设备、存储介质及程序产品

一种阻隔膜及其制备方法和应用

一种粉末取样器

一种建筑通风节能系统

多相电感器及其制备方法、充电设备及电子设备

多维相关技术

一种引线框架多维检测装置_李绍波_202323476922.3

多维度货物测量信息处理方法及系统_众加利(上海)测量技术有限公司_202411289821.1

web服务拟态多维模糊判决方法及系统_河南嵩山实验室产业研究院有限公司洛阳分公司_202411038785.1

一种外墙贴砖多维平整度智能检测装置_中国建筑第五工程局有限公司_202410825549.8

基于策略梯度算法和博弈的分布式多维网络资源切片方法_山东科技大学_202410970698.3

一种多维度双矢量光束聚焦的光学超表面_东南大学_202111599378.4

一种基于多维时间序列异常观测的模糊测试方法及设备_杭州海康威视数字技术股份有限公司_202411088866.2

一种电驱动总成噪声多维度评价方法、系统及存储介质_中汽研(天津)汽车工程研究院有限公司_202411259900.8

一种基于多维数据融合的侦查方法及系统_湖南警察学院_202411266602.1

一种基于多维图像的焊缝质量自评估方法及系统_广东省科学院智能制造研究所_202410909865.3

博弈相关技术

一种基于分时电价的车网博弈优化调度方法_安徽工业大学_202410777035.X

基于权重关系区间直觉模糊斯塔克伯格博弈策略生成方法_中国人民解放军国防科技大学_202410933085.2

一种基于非合作博弈的电动重卡换电调度方法_中国长江电力股份有限公司_202410952647.8

基于主从博弈理论的虚拟电厂分布式协同优化运行方法_国网山西省电力公司电力科学研究院_202410769654.4

考虑实时需求响应的虚拟电厂两阶段博弈运行优化方法_杭州电子科技大学_202411028878.6

基于策略梯度算法和博弈的分布式多维网络资源切片方法_山东科技大学_202410970698.3

变后掠高超声速滑翔飞行器自适应变构博弈制导方法_北京航空航天大学杭州创新研究院_202411269179.0

一种含高比例风电的新型电力系统灵活性资源供需博弈优化调度方法_昆明理工大学_202211084627.0

一种基于博弈意图特征和数据驱动的车辆轨迹预测方法_天津大学合肥创新发展研究院_202410882790.4

考虑源荷博弈的混合时间尺度电热综合能源系统优化方法_燕山大学_202410745716.8

算法相关技术

一种结合RRT算法与VO算法的无人船路径规划方法_上海交通大学_202211008564.0

故事读者阅读中断的算法确定_谷歌有限责任公司_201880096938.4

基于RC4加密算法和XB算法的网络数据处理方法和系统_阜阳师范大学_202410864118.2

基于抗量子加密算法的高效存储架构_哈尔滨工程大学_202410927973.3

基于物理的电动马达冷却剂流算法_通用汽车环球科技运作有限责任公司_202311414833.8

基于语义信息的夜视图像生成算法_天津大学_202310372788.8

算法测试方法、装置、设备、存储介质和程序产品_中国移动通信有限公司研究院_202410217524.X

基于智能推荐算法的智能立库系统_三峡高科信息技术有限责任公司_202410356168.X

基于小样本情况下的手势识别算法_无锡太湖学院_202410774370.4

集成式有源滤波器控制算法_山东正弦电气科技有限公司_202410782005.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于策略梯度算法和博弈的分布式多维网络资源切片方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务