首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于分层深度强化学习的空天地一体化网络任务卸载方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:内蒙古大学

摘要:本发明公开了一种基于分层深度强化学习的空天地一体化网络任务卸载方法,包括构建空天地一体化模型,并利用训练好的强化学习模型在空天地一体化模型的状态空间中选取最优卸载动作执行任务卸载;强化学习模型采用改进的SAC算法选择任务卸载动作,并计算动作产生的熵值和动作奖励,动作奖励根据任务卸载的时延和能耗计算得到;根据熵值和动作奖励计算各个时隙的奖励期望,并通过最大化经各个时隙累积的奖励期望,输出最优动作;强化学习模块在计算奖励期望时,采用温度系数控制最大熵项的权重,并在优化的过程中对温度系数进行自适应调整本发明能够考虑任务卸载的时延和能耗利用强化学习策略实现最优的任务卸载。

主权项:1.一种基于分层深度强化学习的空天地一体化网络任务卸载方法,其特征在于,包括以下步骤:构建空天地一体化模型,并利用训练好的强化学习模型在所述空天地一体化模型的状态空间中选取最优卸载动作执行任务卸载;所述强化学习模型采用改进的SAC算法选择任务卸载动作,并计算动作产生的熵值和动作奖励,所述动作奖励根据任务卸载的时延和能耗计算得到;根据所述熵值和所述动作奖励计算各个时隙的奖励期望,并通过最大化经各个时隙累积的奖励期望,输出所述最优动作;所述强化学习模块在计算所述奖励期望时,采用温度系数控制最大熵项的权重,并在优化的过程中对所述温度系数进行自适应调整。

全文数据:

权利要求:

百度查询: 内蒙古大学 一种基于分层深度强化学习的空天地一体化网络任务卸载方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。