Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 桂林理工大学邱斌获国家专利权

桂林理工大学邱斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉桂林理工大学申请的专利基于交替迭代优化的深度确定性梯度策略计算卸载方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119402495B

龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411531774.7,技术领域涉及:H04L67/10;该发明授权基于交替迭代优化的深度确定性梯度策略计算卸载方法是由邱斌;李学礼;肖海林;闭合;李嘉;刘红霖;李国威设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。

基于交替迭代优化的深度确定性梯度策略计算卸载方法在说明书摘要公布了:本发明涉及深度强化学习技术领域,具体涉及一种基于交替迭代优化的深度确定性梯度策略计算卸载方法,在物联网设备与边缘计算服务器节点协作式应用场景下建立任务卸载决策模型,并通过将模型中耦合的终端设备卸载策略、边缘节点资源分配及位置部署变量建模为三个智能体,设计相应的马尔科夫过程,利用智能体交替训练学习求解,本发明的优化目标在于降低系统的时延及能耗加权和,与现有技术相比,解决了传统深度强化学习算法因探索动作空间维度长陷入局部最优解的问题,实现了在动态计算任务卸载环境中的快速卸载决策,从而提升用户体验。

本发明授权基于交替迭代优化的深度确定性梯度策略计算卸载方法在权利要求书中公布了:1.一种基于交替迭代优化的深度确定性梯度策略计算卸载方法,其特征在于,包括下列步骤: 步骤1:将应用场景下的终端设备卸载策略、边缘节点资源分配及位置部署变量建模为三个智能体,设计相应的马尔科夫过程; 在步骤1中,将终端设备卸载决策、无人机资源分配及位置部署分别建模为三个智能体进行交替决策优化;三个智能体的状态空间为: ; 其中,表示智能体在时隙观察到所构建模型的环境状态,其中为终端设备在时隙产生的计算任务集合;表示智能体1在时隙时的动作;表示智能体2在时隙时的动作;表示智能体3在时隙时的动作; 三个智能体的动作空间分别为终端设备的卸载决策集合、无人机主频分配系数集合以及无人机的位置坐标,表示如下: ; 其中,为终端设备的二进制卸载策略变量,等于1表示终端设备卸载任务至边缘节点进行计算,否则将任务进行本地计算;表示边缘节点分配给终端设备的CPU主频系数比例即资源分配策略;表示边缘节点位置坐标即位置部署策略; 步骤2:初始化每个智能体的观测环境状态空间; 步骤3:智能体根据状态空间交替执行动作; 步骤3的执行过程,包括下列步骤: 步骤3.1:将时隙智能体2和智能体3的动作和当前环境中的任务大小合并得到智能体1在时隙的状态并输入其Actor网络,得到智能体1在时隙的动作; 步骤3.2:将时隙智能体1智能体3的动作和当前环境中的任务大小合并得到智能体2在时隙的状态并输入其Actor网络,得到智能体2在时隙的动作; 步骤3.3:将时隙智能体1智能体2动作和当前环境中的任务大小合并得到智能体3在时隙的状态并输入其Actor网络,得到智能体3在时隙的动作; 步骤4:将所有智能体动作进行合并输入环境,得到当前状态下的奖励值和下一个环境状态; 步骤5:处理智能体的经验池; 步骤6:抽取N条经验更新智能体的神经网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林理工大学,其通讯地址为:541004 广西壮族自治区桂林市七星区建干路12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。