电子科技大学孙罡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于深度强化学习的无人机轨迹和资源调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119545430B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411347042.2,技术领域涉及:H04W28/08;该发明授权一种基于深度强化学习的无人机轨迹和资源调度方法是由孙罡;王智颖;虞红芳;罗龙;孙健设计研发完成,并于2024-09-26向国家知识产权局提交的专利申请。
本一种基于深度强化学习的无人机轨迹和资源调度方法在说明书摘要公布了:本发明公开了一种基于深度强化学习的无人机轨迹和资源调度方法,属于资源调度技术领域,本发明利用物理网络的数字孪生网络对通信交互过程进行实时模拟和优化;通过最小化所有用户设备在平均时隙内的任务完成时延实现对多无人机边缘网络中任务卸载服务的QoE目标,以提升整个网络的服务效率和用户体验。针对所构建的优化目标,采用深度强化学习算法结合变分自编码器模块,解决混合动作空间问题。以有效处理连续和离散的动作空间,提升算法的决策能力。此外,还引入了图注意力网络模块,使无人机能够自适应地捕捉其他无人机的状态特征,从而做出更加精准的联合决策。这种联合决策机制能够显著提升多无人机边缘网络的任务卸载效率和服务质量。
本发明授权一种基于深度强化学习的无人机轨迹和资源调度方法在权利要求书中公布了:1.一种基于深度强化学习的无人机轨迹和资源调度方法,其特征在于,在地面基站端部署有数字孪生网络的多无人机辅助任务卸载的边缘网络系统中,通过数字孪生同步链路与物理网络建立虚拟连接,以通过数字孪生网络实时收集系统的通信交互信息,并执行下列资源调度步骤: 采用0-1卸载策略设置用户到无人机,以及用户卸载计算资源的卸载策略,定义xm,nt表示用户m将任务卸载到无人机n的卸载策略,若xm,nt=1,则表示将任务卸载到人机;其中,m=1,2,…,M,n=1,2,…,N,M、N分别表示用户数量和无人机数量;若xm,nt=0,则表示将任务不卸载到无人机;定义xm,0t表示用户卸载计算资源的卸载策略,若xm,0t=1,则表示用户m选择本地计算,若xm,0t=0,则表示用户m选择卸载到多接入边缘计算MEC上计算; 构建优化目标: 其中,X表示任务卸载决策集合,Ω表示无人机位置集合,P表示设备发射功率集合,O表示任务优先级集合,t表示时隙,T表示时隙数,和分别为任务边缘计算的时延和任务本地计算的时延; 基于马尔可夫决策过程和双重价值网络实现优化目标的优化求解,基于优化结果得到资源调度结果; 其中,双重价值网络包括第一价值网络、第二价值网络、图注意力网络和和动作网络,其中,图注意力网络的输入为系统的当前状态s,该状态s包括用户任务状态和无人机位置,图注意力网络以无人机为节点,无人机特征作为节点特征构建无向图G,其中无人机特征包括位置和当前时刻覆盖范围内的任务量总和;并基于注意力机制计算无向图G的不同邻居节点之间的注意力系数,再采用softmax函数对其进行归一化得到不同邻居节点之间的归一化注意力系数;基于该归一化注意力系数采用多头注意力机制得到增强无人机特征并将其作为动作网络的输入;动作网络用于生成潜在离散动作向量和潜在连续动作向量,再将无人机特征、潜在离散动作向量和潜在连续动作向量和基于奖励函数即时奖励送入第一价值网络,以获取目标价值;第二价值网络的输入包括无人机特征、潜在离散动作向量、潜在连续动作向量和即时奖励,用于输出当前价值,基于两个价值网络的输出计算对应的价值损失并对动作网络的网络参数进行调优,再基于图注意力网络、动作网络、条件变分自编码器中的解码器获取所构建的优化目标的优化结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励