首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于李雅普诺夫和深度强化学习的任务卸载方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:本发明涉及了多移动设备和单个边缘服务器之间的端边协同任务处理系统。移动设备通过无线信道卸载计算密集型任务到边缘服务器,可以选择在本地计算和边缘计算两种模式,并且构建了一个以最小化任务能耗和时延的加权和为目标的长期系统优化问题。我们通过引入虚拟能量队列和李雅普诺夫函数,保证系统稳定性的同时最小化能耗和时延。引入多智能体深度强化学习方法,利用双层竞争深度神经网络结构进行任务迁移比例、CPU周期频率与传输功率的优化。算法通过经验回放机制和梯度下降算法训练智能体的actor和critic网络,实现各终端设备在动态环境中的最优策略学习。与现有技术相比,本发明能够有效降低任务处理时延和能耗,保证系统稳定性。

主权项:1.一种基于李雅普诺夫优化和深度强化学习的边缘计算任务卸载方法,应用于移动边缘计算任务卸载,其特征在于,包括以下步骤:步骤1、基于由多个移动设备和单个边缘服务器组成的MEC系统,分别建立本地计算和边缘计算的时延、能耗模型,构建一个以最小化时延和能耗的加权和为目标的优化问题;步骤2、针对最小化时延和能耗的加权和为目标的优化问题,引入李雅普诺夫虚拟能耗队列,并应用李雅普诺夫漂移加惩罚函数将原问题重构为独立时隙策略优化问题;步骤3、针对独立时隙策略优化问题的非凸性,使用多智能体深度强化学习方法,利用双层竞争深度神经网络结构进行任务迁移比例、CPU周期频率与传输功率的优化;步骤4、通过经验回放机制和梯度下降算法训练智能体的actor和critic网络,实现各终端设备在动态环境中的最优策略学习。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 一种基于李雅普诺夫和深度强化学习的任务卸载方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。