首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于双优化模型的AI加速卡资源调度方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军96901部队

摘要:本发明属于电数字数据处理及资源调度技术领域,公开了一种基于双优化模型的AI加速卡资源调度方法。所述方法包括:构建最优资源调度总模型及对应的目标函数;将最优资源调度总模型简化成全局级的多任务执行序列排布和局部级的加速卡核分配双优化模型;分别采用改进的带精英策略的自适应遗传算法和拉格朗日乘子法优化求解,得出求解结果即加速卡资源调度方案。所述方法将AI加速卡本身特点与多任务处理的需求、优先顺序、所需计算资源结合,快速得出调度方案,提高了有限数量的加速卡应对多任务的整体计算效率,实现了AI计算资源智能、动态和高效的管理。

主权项:1.一种基于双优化模型的AI加速卡资源调度方法,其特征在于,包括:S1、构建最优资源调度总模型及对应的目标函数;所述目标函数表述的目标为任务总完成时间最短且在某时刻运行的所有任务所需显存之和不超过加速卡显存大小;S2、将最优资源调度总模型转化为实现全局级的多任务执行序列排布和局部级的加速卡核分配的双优化模型;所述双优化模型用于确定最优的多任务执行顺序并在同一批次任务中确定最优的计算核分配方案,使得该批次任务的计算时间最短;S3、采用改进的带精英策略的自适应遗传算法和拉格朗日乘子法进行优化求解,得到加速卡资源调度方案;S31、设定初始种群数,初始化总轮次及当前循环轮次,当前循环轮次X为1,任务批次为M;M≥2;总轮次的取值范围为200到500;S32、对任务进行实数编码,并随机生成多个个体,形成初始种群;所述个体为任务执行序列的实数编码形式;S33、对于任意个体i,按照任务所需显存大小和加速卡显存大小划分成Mi个批次,计算每个个体i的适应度,所述适应度为任务总完成时间的倒数;对于个体i,任务总完成时间为所有任务的执行时间,包括三部分:个批次任务的总耗时、批次任务间隔时间、各任务超出其预期的完成时间;为相邻任务的间隔时间;所述批次任务间隔时间包括:加速卡在完成某任务后启动运行新任务时的耗时、CPU与加速卡之间数据传输的耗时;各批次任务的耗时通过拉格朗日乘子法计算,具体为:通过局部核优化,在同一批次任务中确定最优的计算核分配方案,使得该批次任务的计算时间最短;S34、通过对个体适应度的交叉概率和变异概率进行动态调整,来执行对种群的交叉与变异,从而不断进化种群;S35、将适应度按从大到小的顺序排序,进行个体选择,得到选择后的个体;S36、判断当前循环轮次X是否等于总轮次,若否,则跳至S33,若是,则得出任务的执行顺序。

全文数据:

权利要求:

百度查询: 中国人民解放军96901部队 一种基于双优化模型的AI加速卡资源调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。