首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多智能体强化学习的车联网频谱共享方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京理工大学

摘要:本发明公开了一种基于多智能体强化学习的车联网频谱共享方法,包括建立车联网系统模型,基于马尔科夫决策过程建立强化学习中观测空间、行为空间、奖励设定的基础模型,然后将系统模型中的车辆链路视为智能体,利用强化学习SACSoftActor‑critic思想设计频谱共享方法。本发明的设计方案能够以合作的方式实现车联网中车辆与车辆Vehicle‑to‑Vehicle,V2V链路和车联与路旁基础设施Vehicle‑to‑RoadsideInfrastructure,V2I链路的频谱共享,保证最大化V2I链路的信道容量和性能和V2V链路载荷的成功传输概率性能。

主权项:1.一种基于多智能体强化学习的车联网频谱共享方法,其特征在于:步骤1、以十字路口对应的各路段作为研究背景建立车联网系统模型,区域内设立有可用来收集并广播信息的基站,存在一定数目的运动车辆,形成了I个V2I通信链路和K个V2V通信链路;用βk[i]表示频谱分配方案的选择,如果βk[i]=1就表示V2V链路k和V2I链路i此时共享了一个频谱子带;此时,共享第i个频谱子带的V2V链路k的信道功率增益表示为:Gk[i]=δk·hk[i]δk表示信道中与频率无关的大尺度衰落效应——阴影效应和路径损耗,hk[i]则表示信道中与频率相关的小尺度衰落功率分量;步骤2、将共享第i个频谱子带的V2I链路i和V2V链路k其对应的接收信噪比表示为: 和 其中干扰功率Ik表示为: Pic和表示第i个V2I发射机和第k个V2V发射机在第i个频谱子带的发射功率,表示所有V2I发射机的干扰信道增益,gk表示从发射机到所有基站的干扰信道B[i]增益,gk'表示来自其他V2V发射机的干扰信道k[i]增益,σ2表示噪声功率;根据香农公式,共享第i个频谱子带的V2I链路i和V2V链路k在第i个频谱子带上信道容量和分别表示为: 和 其中,W是对应的频谱子带的带宽;设置了在限定时间T内,大小为B的数据包在V2V链路上的成功交付率为: B表示V2V链路需要交付的载荷的大小,ΔT是设定的交付时间,V2V链路k在第i个频谱子带上的信道容量和公式里增加了参数t来表示不同时间下V2V链路的容量变化情况;步骤3、基于马尔科夫决策过程建立智能体与环境交互的强化学习基础模型,确定一固定段时间T作为一个周期,获取智能体在环境中做出的行为以及获取的奖励;步骤4、在车联网系统模型中引入强化学习的智能体与环境交互的强化学习基础模型,设计基于多智能体强化学习SAC的频谱共享方法。

全文数据:

权利要求:

百度查询: 南京理工大学 一种基于多智能体强化学习的车联网频谱共享方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。