齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)郭莹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)申请的专利基于DDQN和启发式策略的计算-存储流联合调度优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120371483B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510863895.X,技术领域涉及:G06F9/48;该发明授权基于DDQN和启发式策略的计算-存储流联合调度优化方法及系统是由郭莹;郑镇坤;王迪;张秋萍;岳龙飞;刘袁和设计研发完成,并于2025-06-26向国家知识产权局提交的专利申请。
本基于DDQN和启发式策略的计算-存储流联合调度优化方法及系统在说明书摘要公布了:本发明涉及基于DDQN和启发式策略的计算‑存储流联合调度优化方法及系统,属于分布式计算与智能调度技术领域,包括:(1)计算流与存储流定义;(2)工作流调度与执行:当工作流被触发时,调度器根据任务之间的依赖关系与调度策略,逐个评估任务的可执行状态,并将可执行的任务提交给任务执行器;任务执行器负责在工作节点上执行这些任务,确保按照预定的顺序和优先级完成任务;(3)DAG结构、队列信息和运行数收集;(4)基于历史运行数据的任务运行时间与资源使用预测;(5)基于DDQN和启发式策略调度优化;(6)调度信息获取与保存。本发明显著提升系统的任务执行效率与资源利用率。
本发明授权基于DDQN和启发式策略的计算-存储流联合调度优化方法及系统在权利要求书中公布了:1.基于DDQN和启发式策略的计算-存储流联合调度优化方法,其特征在于,包括: 1计算流与存储流定义; 2工作流调度与执行:当工作流被触发时,调度器根据任务之间的依赖关系与调度策略,逐个评估任务的可执行状态,并将可执行的任务提交给任务执行器;任务执行器负责在工作节点上执行这些任务,确保按照预定的顺序和优先级完成任务; 3DAG结构、队列信息和运行数收集; 4基于历史运行数据的任务运行时间与资源使用预测; 5基于DDQN和启发式策略调度优化; 6调度信息获取与保存; 步骤5中,基于DDQN和启发式策略调度优化,包括: 5-1构建四维状态张量S,如公式6所示: 其中,B表示批量大小,Nt表示任务总数,Nq表示队列总数,D表示特征维度,D为Dtask+Dqueue; 任务特征Dtask为9+Nt,如公式7所示: 其中,w表示任务权重,qassigned表示已分配的队列编号,表示是否为关键路径任务,表示是否为计算流任务,表示是否为触发器任务,表示是否为传感器任务,表示预测的运行时间、CPU、内存,表示依赖任务独热编码; 队列特征:Dqueue,如公式8所示: 其中,cavail表示队列可用CPU资源,ctotal表示队列总CPU资源,mavail表示队列可用内存,mtotal表示队列总内存,savail表示队列可用存储,stotals表示队列总存储,ntasks表示队列中已分配任务数,tend表示队列当前任务结束时间戳; 5-2进行多轮Episode训练,直到满足终止条件;每个Episode包括以下步骤: 环境重置:将仿真环境恢复至初始状态,清空之前的交互历史数据; 任务完成判定:检测当前Episode是否已完成所有预设任务目标,若任务已完成,则跳过后续步骤,直接进入下一Episode; 5-3在当前Episode中,按时间步执行以下操作: 可用动作检测:根据环境当前状态,获得合法动作集合; 从合法动作集合中获取合法动作,验证动作合法性的关键函数Va,如公式9所示: 其中,a表示对任务ti的具体操作,ti表示当前待调度的任务,depsti表示依赖集合,td表示依赖任务,statustd表示任务状态; 根据混合epsilon-greedy与启发式规则a,如公式10所示,选择最优的动作; 其中,∈表示探索率,θonline表示在线网络参数,表示任务i的合法队列集合; j表示合法队列集合中的一个动作,Q表示强化学习中Q值函数,Heuristic表示启发式策略函数; 启发式规则优先将任务分配到当前负载高但需求匹配度低的队列,避免资源过载,如公式11所示: 对每个队列j,计算其负载评分LoadScorej,如公式12所示: 表示CPU重要性权重,表示内存重要性权重; CPU使用率如公式13所示: availablecpuj表示队列j当前可用CPU核数,Ctotal表示队列j的总CPU配额; 内存使用率如公式14所示: availablememoryj表示队列j当前剩余可用内存,Mtotal表示队列j的总内存配额; 通过多目标加权的方式,综合评估调度动作的优劣,如公式15所示: R=wbalance*rbalance+wtaskbalance*rtaskbalance+wdependency*rdependency+wlocal*rlocal-λ·penalty15; 其中,wbalance表示资源负载均衡评分的权重;rbalance表示资源负载均衡得分;wtaskbalance表示任务数量均衡评分的权重;rtaskbalance表示任务数量均衡评分;wdependency表示依赖完成奖励的权重;rdependency表示依赖完成奖励;wlocal表示局部利用率奖励的权重;rlocal表示局部利用率奖励;λ表示全局差异惩罚的惩罚系数;penalty表示全局差异惩罚; 具体评分项如下: 负载均衡评分rbalance表示各队列CPU内存利用率的均衡性,如公式16所示: 其中,uc表示各队列的CPU利用率,um表示各队列的内存利用率,σ·标准差,衡量资源利用率的波动性; 任务数量均衡评分rtaskbalance表示各队列任务数的均衡性,如公式17所示: 其中,ntasks各表示队列的任务数量,σntasks表示任务数量标准差,maxntasks表示所有队列中最大任务数; 依赖完成奖励rdependency表示未完成依赖任务数的惩罚,如公式18所示: 其中,td表示当前任务的依赖任务,表示指示函数,若依赖任务未完成则值为1,否则为0; 局部利用率奖励rlocal表示当前队列的CPU内存利用率,如公式19所示: 其中,表示当前队列j的CPU利用率,表示当前队列j的内存利用率; 全局差异惩罚为penalty表示各队列最大与最小CPU利用率的差异,如公式20所示: penalty=maxuc-minuc20; 其中,maxuc表示所有队列中最大CPU利用率,minuc表示所有队列中最小CPU利用率; 5-4通过持续的交互过程不断采集经验数据保存在经验回放缓冲区,在每一次任务调度过程中,记录一个五元组形式的交互样本,如公式21所示: state,action,reward,next_state,done21; 其中,state表示当前调度环境的状态,action表示智能体在当前状态下做出的调度决策,reward表示当前调度动作带来的即时反馈,next_state表示动作执行后环境的下一状态,done表示当前调度过程是否已结束,为布尔值; 通过不断执行调度动作,逐步收集五元组,并将五元组存储到经验回放池中; 当样本数量达到一定规模后,从中采样构成一个训练集,用于对Q值函数进行优化训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心),其通讯地址为:250353 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。