买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:控环科技集团有限公司
摘要:本发明公开了一种考虑功耗故障的通信无人机路径规划和带宽分配方法,包括以下步骤:S1、根据应用场景中真实物理实体构建物理环境,并将场景数据同步到中央服务器;S2:中央服务器构建数字孪生模型,并实现场景数据的状态更新;S3:在中央服务器中设置经过训练学习的机器学习模型,包括ESN预测模块和DRL决策优化模块,ESN预测模块从数字孪生模型中获取状态更新后的场景数据并预测出用户智能终端在下一时隙的位置信息;DRL决策优化模块根据ESN预测模块预测出的用户智能终端在下一时隙的位置信息实现无人机路径规划和带宽分配。其效果是:能同时实现无人机路径规划和带宽分配,有效避免用户智能终端因为计算任务过重导致的过热问题。
主权项:1.一种考虑功耗故障的通信无人机路径规划和带宽分配方法,其特征在于,包括以下步骤:S1、根据应用场景中真实物理实体构建物理环境,所述真实物理实体包括无人机、用户智能终端和场景中的固定物体;无人机获取各个用户智能终端的信息,并将场景数据同步到中央服务器;S2:中央服务器根据步骤S1所得物理环境构建数字孪生模型,并实现场景数据的状态更新;S3:在中央服务器中设置经过训练学习的机器学习模型,包括ESN预测模块和DRL决策优化模块,所述ESN预测模块从所述数字孪生模型中获取状态更新后的场景数据并预测出用户智能终端在下一时隙的位置信息;所述DRL决策优化模块根据所述ESN预测模块预测出的用户智能终端在下一时隙的位置信息实现无人机路径规划和带宽分配;所述ESN预测模块包括输入层、存储池和输出层,设定物理环境中存在N个用户智能终端,所述输入层的输入向量uint为当前N个用户智能终端的位置信息,所述输出层的输出向量youtt为下一时隙N个用户智能终端的位置预测信息;所述存储池的状态向量由表示,且按照:xrest=1-αlxrest-1+αltanhWinuint+Wresxrest-1进行更新,其中:αl∈0,1]是保证xrest平滑更新的泄漏率,tanh·是激活函数,表示存储池和输入层之间的权重矩阵,是存储池神经元本身之间的权重矩阵,Win和Wres在网络初始化时随机生成,并在整个训练阶段保持不变,Nres为存储池中神经元的数量;所述输出层按照youtt=Wout[uint;xrest]确定输出向量,其中:[uint;xrest]表示向量uint和xrest的垂直串联,是输出层和存储池之间的权重矩阵,且通过学习训练确定;在对ESN预测模块进行学习训练时,训练目标函数为: 其中:Wout的第n行记为wout,n,||·||代表欧几里德范数,δ||wout,n||2是避免过度拟合的Tikhonov正则化项,δ是正则化参数,ytarget,nt表示训练样本中实际位置信息向量ytargett的第n个元素,yout,nt为输出向量youtt的第n个元素,T为训练样本时隙长度,最优权重矩阵通过岭回归得到,具体如下: 其中Ytarget∈R2N×T和分别是训练时隙上ytargett和[uint;xrest]的堆叠版本,I为单位矩阵;所述DRL决策优化模块收到时隙t的状态信息为:st=[qpt,Hdiagt,Tsurt]其中:qpt为所述ESN预测模块输出的N个用户智能终端的位置预测信息,Hdiagt=HtHHt是一个对角矩阵,主对角线的条目表示功率衰减,为复数形式的信道矩阵;HHt是信道矩阵Ht的共轭转置矩阵;NRx为用户智能终端天线数量,NTx为无人机天线数量,Tsurt为用户智能终端的设备温度;且按照问题P1作出决策动作qut+1和wt,其中,问题P1定义为: subjectto1,6,7and16qut+1表示下一时隙无人机的坐标位置,wt表示当前时隙分配给各个用户的智能终端的带宽,Rnt表示当前时隙下第n个用户智能终端的下行速率;各个限制条件具体为:条件1:两个相邻时隙之间无人机的移动距离小于或等于预设阈值Dmax;条件6:wnt表示分配给第n个用户智能终端的带宽,P表示无人机的总功率,N0表示噪声谱密度,ρth为预设的信噪比阈值,det表示计算矩阵行列式;条件7:分配给各个用户的智能终端的带宽之和小于或等于无人机的总带宽用;条件16:其中,表示第n个用户智能终端在当前时隙下的芯片发热功率,表示第n个用户智能终端的状态函数,状态变量为第n个用户智能终端的设备温度,Tsafet为用户智能终端的热极限值;hair代表空气的对流换热系数,单位为:Wm2·K,A表示散热器面积,单位为cm2,Tenv表示环境温度;为了满足条件1,用dt,0≤dt≤Dmax表示无人机在两个相邻时隙之间的移动距离,水平面中相应的移动角度用ξt,0<ξt≤2π表示,则qut+1=xut+1,yut+1按照:xut+1=xut+dt*cosξt,yut+1=yut+dt*sinξt确定;所述DRL决策优化模块设置有奖励函数,用于优化长期预期总吞吐量,所述奖励函数为: 其中:和是惩罚权重;惩罚变量B为无人机的总带宽;惩罚变量
全文数据:
权利要求:
百度查询: 控环科技集团有限公司 考虑功耗故障的通信无人机路径规划和带宽分配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。