Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于D3QN的6G超大规模车联网网络资源分配方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆理工大学

摘要:本发明涉及无线通信技术,具体公开了一种基于D3QN的6G超大规模车联网网络资源分配方法及系统,包括以下步骤:S1、根据6G超大规模车联网的应用场景确定通信模型;S2:根据所述通信模型建立超图模型,所述超图模型中顶点为车载用户,超边为有干扰的车辆链路;并通过邻接矩阵表示超图中的车辆链路关系;S3:以最大化整个车联网的吞吐量为目标定义网络资源分配问题并设定约束条件;S4:基于竞争双重深度网络D3QN确定最优资源分配策略。其效果是:可以有效地描述复杂拓扑结构和多维特征,自适应地调整资源调度方案,更好地优化资源调度问题,有效地平衡系统中的多个目标和约束,降低干扰,提升吞吐量、减少时延。

主权项:1.基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,包括以下步骤:S1、根据6G超大规模车联网的应用场景确定通信模型;S2:根据所述通信模型建立超图模型,所述超图模型中顶点为车载用户,超边为有干扰的车辆链路;并通过邻接矩阵表示超图中的车辆链路关系;S3:以最大化整个车联网的吞吐量为目标定义网络资源分配问题并设定约束条件;S4:基于竞争双重深度网络D3QN确定最优资源分配策略;步骤S1中所述6G超大规模车联网的应用场景包括N个车载用户和K条车辆链路,并采用D2D通信,网络中所有收发机使用单一天线,且第k条车辆链路的信道功率增益为: 第k条车辆链路使用第m个信道进行通信的信噪比为: 第k条车辆链路使用第m个信道进行通信的容量为:Ck[m]=W·log1+γk[m]其中:表示大尺度慢衰落信道参数,αk是具有标准差的对数正态阴影衰落随机变量,A表示路径损耗常数,Lk表示车载用户到车载用户之间的距离,l表示衰落指数,gk表示小尺度快衰落信道参数,Pk表示第k条车辆链路发送端的发射功率;σ2表示信道中的高斯白噪声的功率;表示频谱分配指标,当第k'条车辆链路复用第k条车辆链路的信道时否则Pk′表示第k'条车辆链路发送端的发射功率;hk′,m为第k'条车辆链路的信道功率增益,M为信道总数,W是信道带宽;步骤S2建立超图模型时用表示,顶点集表示车辆用户集合,超边集ε表示顶点所构成干扰边的集合,对于车辆链路用户对,干扰边的构建原则为:如果有用信号与累积干扰之比低于阈值δd,则累积干扰和VUE一起形成超边缘,即: 在车辆链路中;所述超图模型中的通信链路关系用邻接矩阵来描述,其中行表示顶点,列表示超边,he,v=1表示第e个车载用户使用第v条车辆链路进行通信;否则,he,v=0;令0≤Kk[m]≤K表示第m个信道中需要配置的车辆链路个数,则令τk[m]∈{0,1}表示第k个车辆链路是否配置在第m个信道处,则有: 其中,K为车辆链路总条数,当τk[m]=0则表示资源分配无冲突;步骤S4中基于竞争双重深度网络D3QN确定最优资源分配策略时,定义有状态空间S、动作空间即时奖励R和动作价值函数Q,其中:状态空间S:当前全局状态St的全局状态由所有车辆链路的信道分配以及车辆用户的资源分配动作组成;且在网络环境中可以采用动作从当前全局状态St过渡到下一个状态St+1;动作空间用于表示智能体执行的动作集,即第k个车载用户在系统中观察当前状态做出相应通信链路资源分配的动作集合;即时奖励R:用于表示车载用户在状态空间S下执行动作空间获得的对应回报;设立了如下奖励函数: 其中λ1,λ2和λ3是定义奖励的三个部分的权重系数,表示该信道被使用的比例与该信道被使用的最小比例之间的差,如果一个信道块被使用得越多,即接近1,那么智能体就会得到更多的奖励;反之亦然;表示该车载用户的队列长度,若队列长度越小,即接近0,那么智能体就会得到更多的奖励;反之亦然;Ux是一个分段函数,它表示了资源利用率、队列长度和干扰之间平衡的奖励函数; 其中A<0,在时隙t,所有的智能体独立地采取他们的动作,全局奖励Rt在BS处被评估,智能体在每个时隙结束时获得全局奖励的评估,由BS以小的信令开销广播;动作价值函数Q:用于表示车载用户在状态空间S下执行动作空间的期望回报;所述动作价值函数Q表示为: 其中∑a′As,a′是对所有动作的优势函数求和,|A|是动作空间的大小,表示所有可能动作的总数,Vs是只与状态s有关的状态价值函数,As,a是优势函数,表示在状态s下,相比与于其他动作,选择动作a具有相对优势;D3QN的目标值的计算方式为: 其中,yt表示当前时刻的目标值,rt+1表示下一时刻的奖励,γ表示折扣因子,wθ和wt分别是评估网络和目标网络的参数,利用评估网络选择最优动作,然后利用目标网络计算该动作的价值,从而避免了最大化操作导致的Q值过估计问题。

全文数据:

权利要求:

百度查询: 重庆理工大学 基于D3QN的6G超大规模车联网网络资源分配方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。