买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:大连理工大学
摘要:本发明公开一种多对多边缘计算场景下的计算卸载方法及系统,包括:获取多边缘服务器多移动终端场景下的边缘计算场景数据,并基于边缘计算场景数据,构建边缘计算场景;基于边缘计算场景,构建卸载模型,其中卸载模型基于马尔科夫决策过程进行建模;通过策略迭代法对卸载模型进行求解,得到最优卸载策略。本发明能够对于不同性质的终端产生的的异构任务,以能量消耗最小化为目标进行任务卸载建模,并获取卸载方法的最优策略。
主权项:1.一种多对多边缘计算场景下的计算卸载方法,其特征在于,包括:获取多边缘服务器多移动终端场景下的边缘计算场景数据,并基于边缘计算场景数据,构建边缘计算场景;基于边缘计算场景,构建卸载模型,其中卸载模型基于马尔科夫决策过程进行建模;通过策略迭代法对卸载模型进行求解,得到最优卸载策略;所述卸载模型包括状态空间,动作空间,奖励函数,策略及回报;其中状态空间包括若干个不同状态,所述状态包括各车辆位置,各车辆下的剩余计算能力及各边缘服务器剩余计算能力;动作空间包括若干个不同动作,所述动作包括本地处理及边缘服务器卸载处理动作;所述奖励函数基于本地处理能耗及卸载处理能耗进行构建;所述策略为不同状态下不同动作的概率;所述回报为通过对奖励函数进行计算得到的总奖励;通过策略迭代法对卸载模型进行求解的过程包括:基于卸载模型,构建状态值函数,其中状态值函数为不同状态下采用不同策略时,各车辆的奖励函数值的数学期望总和,其中奖励函数值由奖励函数计算得到;对状态及策略进行初始化,基于初始化的状态及策略对状态值函数进行计算,获取初始状态值,然后对状态及策略进行迭代更新,更新过程中,基于迭代更新的状态及策略对初始状态值进行更新,直到更新的状态值收敛,获取收敛状态值下的策略即最优卸载策略;获取多边缘服务器多移动终端场景下的边缘计算场景数据,并基于边缘计算场景数据,构建边缘计算场景的过程包括:一个由若干个边缘服务器覆盖下的工业园区内,若干种AGV车辆在园区内执行运输任务;假设共有m个边缘服务器组成一个集合EC={EC1,EC2,EC3...ECm},并在工业园区内均匀分布;AGV车辆数为n,组成一个集合AGV={AGV1,AGV2,AGV3...AGVn};AGVi在某一时刻产生多个任务,AGVi产生的任务集合为Ti={Ti1,Ti2,Ti3...},且Ti∈T={T1,T2...Tn}表示所有AGV车辆产生的任务总集合;所有任务产生后有两种处理方式:本地处理和卸载到某个边缘服务器处理;任务其中ω表示任务的紧急程度,根据紧急程度将任务分为:紧急任务和非紧急任务,分别被AGV车辆标记为{0,1};对于紧急任务直接由本地处理,并且可以抢占非紧急任务的计算资源;对于非紧急任务,则利用马尔可夫决策过程的建模方法,以AGV车辆能量消耗最小化为目标进行决策,来判断各任务的处理方式;表示任务的数据量大小;θ表示任务量化后的优先级值,优先级值根据任务的紧急程度,对延迟的敏感程度以及对工业园区整体运行的影响大小来确定,优先级高的任务在调度过程中,在任务缓存队列中优先处理;基于边缘计算场景,构建卸载模型,即建立“多对多“边缘计算的任务卸载模型,具体的:卸载模型主要由五个元组组成{S,A,R,π,r},S为状态空间,该时间段内状态St={x,y,fAGV,fEC},包括各个AGV车辆的位置,各AGV车辆的剩余计算能力,各边缘服务器剩余计算能力;A为动作空间,由该时间段内所有车辆的动作组成,A={a1,a2,a3...an},A表示各AGV车辆对于本身产生的所有任务的处理方式的集合,包括:本地处理和卸载到某一边缘服务器处理;R为奖励函数,主要是与各AGV车辆处理任务的总能耗相关的函数;π为策略,表示各状态下AGV车辆做出各种动作的概率;r为回报,表示最终得到的总奖励;对于奖励函数R,定义如下:①对于本地处理的任务,根据是否超过AGV车辆计算能力上限分为两种情况, ②卸载到边缘云服务器的任务: 由于利用马尔可夫决策过程的最终目标为:确定各AGV车辆产生的所有任务是卸载到边缘服务器处理还是本地处理,得到最终回报等于各AGV车辆奖励函数之和: 在任务卸载过程中考虑各个AGV车辆剩余计算能力,各个边缘服务器剩余计算能力,也就是说各个边缘服务器接受的任务或者AGV车辆自行处理的任务不能超过其处理能力上限;通过策略迭代法对卸载模型进行求解,得到最优卸载策略即确定最优卸载策略,具体的:对于上述得到的卸载模型,采用策略迭代法进行求解最优策略;马尔可夫决策过程方法中每一种状态对应一个状态值函数:Vπsi=Eπ[ΣRi|si]该函数表示由当状态为si、所以采用的策略为π时,各AGV车辆产生的所有任务做出决策后的奖励函数值R的数学期望之和;给定一个初始状态s0和初始策略π0,求得该策略下s0的Vs值,根据Vs值进行策略改进,然后继续根据新的Vs值,进行新一轮策略改进,直到最后收敛,利用贪婪算法得到最优策略的近似解;在随机初始状态s0和初始策略π0下,该方法具体包括以下步骤:步骤一:随机选定一个AGV车辆,只调整该AGV车辆的任务分配策略,同时保证各个服务器的计算能力上限以及AGV车辆本身的计算能力上限,在不改变其他AGV车辆分配策略的前提下使Vs达到最大;步骤二:和步骤一一样,只随机改变一个AGV车辆的任务分配策略,但步骤一中的AGV车辆的分配策略保持不变;步骤三:和步骤二一样,只随机改变一个AGV车辆的任务分配策略,但步骤一、步骤二中的选择的AGV车辆的分配策略保持不变;以此类推,一个循环后最终得到一种较优于初始策略π0的一种策略;开始下一个循环:改变步骤一中选出的AGV车辆,便得到各种情况下的策略,比较选择其中Vs值最大的策略,此时该策略下终端的总能耗最小。
全文数据:
权利要求:
百度查询: 大连理工大学 一种多对多边缘计算场景下的计算卸载方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。