买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东工业大学;东莞理工学院
摘要:本发明公开了一种基于区块链的无人机UAV辅助车联网频谱分配方法,构建UAV辅助的车联网区块链资源管理模型,为每个UAV节点配置唯一节点列表UNL,UniqueNodeList;车辆向所连接的UAV主节点提交频谱请求,主节点设定优化问题并采用深度强化学习方法求解得到车辆与UAV之间的通信频谱和发射功率;主节点将请求事务广播给UAV节点,UAV节点采用瑞波共识机制对请求事务执行智能合约和共识协议,UAV节点对交易进行投票,确认请求事务是否通过;将未通过的请求事务丢弃,对通过的请求事务将所有车辆信息、交易记录和时间戳打包到一个新的区块中,并附加到区块链上,广播至所有UAV节点,从而确认请求频谱的车辆请求得到的频谱和发射的功率。本发明以分布式结构管理无线资源,降低拥堵,提高资源利用率和可靠性。
主权项:1.一种基于区块链的无人机辅助车联网频谱分配方法,其特征在于,包含以下步骤:步骤一:构建UAV辅助的车联网网络,获取车联网网络中的UAV数目、车辆数目、子信道数目、中断概率和时延信息,并通过获取的信息构建区块链资源管理模型,为每个UAV节点配置一个可信节点列表,称为唯一节点列表UNL;步骤二:车辆接入的UAV节点为主节点,车辆向主节点提交频谱请求,主节点设定优化问题并采用深度强化学习方法求解,得到车辆与UAV之间的通信频谱和发射功率;步骤三:主节点将请求事务广播给唯一节点列表UNL上的UAV节点,UAV节点收到请求后,采用瑞波共识机制对请求事务执行智能合约和共识协议,唯一节点列表UNL中的UAV节点对交易进行投票,确认请求事务是否通过;步骤四:将未通过的请求事务丢弃,对通过的请求事务,将所有车辆信息、交易记录和时间戳打包到一个新的区块中,并附加到区块链上,广播至所有UAV节点;所述UAV辅助的车联网网络由多个UAV和车辆组成,UAV数目为U,车辆数目为I,每个UAV在一个设定区域内飞行,作为空中基站协助车辆源节点和目标节点之间通信,UAV辅助通信链路为车辆提供高可靠性和低延迟的通信,系统频谱在所有UAV之间共享,系统信道数目为N;所述区块链资源管理模型具体为:针对UAV对车辆发送信息链路的下行传输系统,假定信息传输为周期性的数据包传输;考虑UAV在与车辆通信过程中,其它UAV会对此通信链路带来干扰,UAVu与车辆在信道n的速率Ru,n可表示为 其中,pu,n表示UAVu在信道n的传输功率,是UAVu在信道n对所接入车辆的信道增益,是UAVu'在信道n对其它UAV所接入车辆的信道增益,和由所有车辆的信道增益统计平均得到,σ2是高斯白噪声功率;当UAV和车辆之间的通信链路的信噪比低于γ0时,UAV对车辆的通信传输将中断;在任意时间周期,数据包没有被成功发送的概率由中断概率Pout,u表示,即信噪比小于γ0的概率;中断概率表达式为 其中,au',n表示UAVu'在信道n的分配变量,假设Yu表示UAVu的数据包的平均发送时间,当数据包在当前时隙未能成功发送时则重新发送,若重传的次数未达到N,则在下一个时隙继续重传,若重传次数已达到N,则选择丢弃;假设每个时隙长度为T,Yu的概率函数表示为 使用Du表示平均发送时延,表达式为 其中,E{·}表示随机变量的均值;所述步骤二具体为:车辆接入车联网后向UAV申请与UAV通信的频谱,UAV接收到车辆的频谱请求后,设定优化问题,而后对优化问题求解得出所请求信道和功率;以优化能量效率为目标,优化问题设定为: s.t.C1:C2:C3:C4:C5:C6:其中au,n表示UAVu在信道n的分配变量,限制条件C1表示连接UAVu的车辆的通信速率高于最小需求,C2和C3分别表示中断概率和平均时延最高限制,C4表示UAV的信道分配变量,C5表示每次申请的信道数目为1,C6表示UAVu的最大发送功率限制;为了解决上述优化问题,采用深度Q学习DQL,DeepQ-Learning方法来获得优化变量值;UAV作为学习代理在时间t感知状态st,并输出策略π,策略π决定采取的动作at,然后执行此动作;为了让学习代理积累经验进而更好地选择动作,环境会给学习代理奖励rt作为反馈;此时,进入到下一个状态st+1,学习代理继续感知st+1,并做出新的策略π,以此类推,最终使环境状态达到收敛,代理获得最大奖励;所述UAV节点采用DeepQ-Learning方法求解优化问题的步骤如下:1将联合优化问题定义为马尔可夫决策过程,定义状态空间、动作空间和奖励函数;状态St中包含了当前t时刻UAV申请的信道Ft和UAV发送的功率Pt;因此,状态空间表示为 Ft、Pt分别表示为: fnt表示在t时刻申请信道n给当前的UAV使用,plt表示在t时刻申请UAV发射功率的大小;根据当前状态St,UAV采取动作At来改变当前环境;动作空间由下式表示 根据状态空间和动作空间,将UAV的能量效率建模为奖励函数,表示为 2定义Qs,a,θ为动作价值函数,表示状态s下动作a的期望总奖励,表达式为Qs,a,θ=E[Rt|st=s,at=a,θ]其中θ是评估网络中设置的权重和偏差;定义经验回放集合D,{st,at,rt,st+1}表示状态变化和对应的动作及奖励的集合;为简化描述,使用Q网络表示DQL方法中的神经网络,使用Q值表示函数Qs,a,θ的值;随机初始化网络的参数θ,基于θ初始化所有状态和动作的Q值,清空经验回放集合D,初始化状态st;3在函数Qs,a,θ中使用状态st作为输入,得到Q网络的所有动作对应的Q值输出,选择最大Q值对应的动作其中Qs,a,θ取最大值时,记为 4在状态st下执行动作at,获得奖励rt,得到新状态st+1,并将{st,at,rt,st+1}存入集合D;5从集合D中随机选择m个样本{{sj,aj,rj,sj+1}},j=1,2,...,m,计算当前目标Q值yj: 表示UAV获得最大的长期奖励,并终止学习;6定义损失函数Lθ表示目标网络与评估网络的输出Q值之差,如式 其中,θ-是在目标网络中设置的权重和偏差,θ是评估网络中设置的权重和偏差;将t时刻和t+1时刻的参数θ分别用θt和θt+1表示;根据Lθ计算神经网络参数的梯度,然后更新参数θt,而后使用参数θt+1更新神经网络模块,表示如下: 7将状态st更新为st+1;重复步骤2~7,直到yj为收敛状态,即得到所请求的信道和功率值。
全文数据:
权利要求:
百度查询: 广东工业大学 东莞理工学院 一种基于区块链的无人机辅助车联网频谱分配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。