首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于负载均衡机制的权重优先Task任务调度方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆邮电大学

摘要:本发明属于资源分配技术领域,公开了一种基于负载均衡机制的权重优先Task任务调度方法,避免单个高权值worker节点负载过高,以及大的task任务直接被丢弃的问题进行改进;首先将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;并动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小,再通过与task分类情况进行映射至各个worker节点,再进行task任务的调度。解决各个高权值worker节点间负载不均衡及队列拥堵的问题。

主权项:1.一种基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述基于负载均衡机制的权重优先Task任务调度方法包括:将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;并动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小,再通过与task分类情况进行映射至各个worker节点,再进行task任务的调度;所述基于负载均衡机制的权重优先Task任务调度方法包括以下步骤;步骤一,将task任务按照读取速度及占用资源量的大小进行分类;步骤二,结合加权轮转算法的思想,对worker节点进行权值的计算;步骤三,在原有模型上加入分布式负载均衡框架;步骤四,将计算出的worker节点上的权值和task分类后的情况进行映射;并且worker权值为0的节点不进行分配,且占用数据量大且读取速度慢类型的task直接进行慢任务备份,并等待权值最大的worker节点进行分配;所述步骤一具体包括:分为占用数据量小且读取速度快、占用数据量小且读取速度慢、占用数据量大且读取速度快、占用数据量大且读取速度慢四类;其中判断task任务大小的方法: 判断task任务是否为慢任务的方法:一个进程上Task平均进度增长率-进程上Task平均任务增长率≤σ慢节点阈。

全文数据:基于负载均衡机制的权重优先Task任务调度方法技术领域[0001]本发明属于资源分配技术领域,尤其涉及一种基于负载均衡机制的权重优先Task任务调度方法。背景技术[0002]目前,业内常用的现有技术是这样的:[0003]在spark源码中,task任务至worker节点的调度过程是按照stage的优先级以及task的本地性进行优先级的区分,默认task采用一个线程来进行计算。在广播task的时候,如果task大于128mb-200mb,则直接将task丢弃。Task将以队列的形式,由master节点分配到各个worker节点。这样会导致各节点之间的分配不均衡,出现高配置节点长期处于饥饿状态,而配置低的节点长期处于满负载状态,导致任务完成时间较长,性能较低,资源利用率较低。在现有的改进算法中,根据worker节点权值进行动态资源分配。每个worker节点通过节点监测模块可以根据自身资源情况及负载变化情况定期动态调整权值大小,master节点调度时读取各节点权值优先选择权值较大节点。但是该算法没有考虑到在高权值的worker节点上等待任务较多,造成任务拥堵的情况。并且,在task任务对worker节点的选择时,仅仅考虑到分配至权值最大的节点,会造成单个worker节点任务数量负载过高的情况。[0004]综上所述,现有技术存在的问题是:现有的改进算法没有考虑到在高权值的worker节点上等待任务较多,造成任务拥堵的情况;在task任务对worker节点的选择时,仅仅考虑到分配至权值最大的节点,造成单个worker节点任务数量负载过高的情况。[0005]解决上述技术问题的难度和意义:[0006]针对Hadoop云平台下,任务调度方案已经出现了很多,也较为成熟。但是在Spark平台下,关于Task的任务调度也出现了一些研究成果。在分布式计算领域中,调度策略的根本目标是根据当前集群中各个Worker节点上的资源包括CPU、内存和网络资源剩余情况与各个Task任务要求,在资源和任务之间做出最优的匹配。并且,各个Worker节点的权值不同,节点的计算能力就不同。因此,分布式系统中的Task任务调度是一个多目标优化问题,更进一步说,它是一个典型的NP问题。发明内容[0007]针对现有技术存在的问题,当前的Spark版本中,在对Task任务的调度过程仅用FIFO的策略进行调度,未考虑到各个Worker节点的计算能力不同的因素,导致计算能力弱的节点阻塞,计算能力强的节点资源闲置。现有的优化策略的研究就过程中,仅考虑到对Worker节点进行权值计算,未考虑到这将导致Task任务阻塞等待Worker节点的资源,以至于增加任务运行时间。本发明提供了一种基于负载均衡机制的权重优先Task任务调度方法。[0008]本发明是这样实现的,一种基于负载均衡机制的权重优先Task任务调度方法,所述基于负载均衡机制的权重优先Task任务调度方法包括:将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;并动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小,再通过与task分类情况进行映射至各个worker节点,再进行task任务的调度。[0009]进一步,所述基于负载均衡机制的权重优先Task任务调度方法包括以下步骤;[0010]步骤一,将task任务按照读取速度及占用资源量的大小进行分类;[0011]步骤二,结合加权轮转算法的思想,对worker节点进行权值的计算;[0012]步骤三,在原有模型上加入分布式负载均衡框架;[0013]步骤四,将计算出的worker节点上的权值和task分类后的情况进行映射;并且worker权值为0的节点不进行分配,且占用数据量大且读取速度慢类型的task直接进行慢任务备份,并等待权值最大的worker节点进行分配。[00M]进一步,所述步骤一具体包括:分为占用数据量小且读取速度快、占用数据量小且读取速度慢、占用数据量大且读取速度快、占用数据量大且读取速度慢四类;[0015]其中判断task任务大小的方法:[0017]判断task任务是否为慢任务的方法:[0018]—个进程上Task平均进度增长率-所以进程上Task平均任务增长率X慢节点阈值。[0019]进一步,所述步骤二具体包括:CU代表:CPU的利用率;MU代表:内存利用率;WCL代表:单个worker节点上负载的队列长度;capacity代表:该worker节点的权值;count代表:权值计算过程中的计算次数;[0020]其中,CPU利用率的计算方法:[0022]内存利用率的计算方法:[0025]其中,Eg量表示内存总量;MU_BI用表示目前可以使用的内存容量;MFree表示空闲内存容量;Mc^he表示缓存容量;[0026]单个worker节点上负载的队列长度计算方法:[0028]其中,WTask表示该worker机上负载task的数量;总Task表示正在运行的task的数量;W植表示该worker机的权值;总植表示所有worker机的总权值。[0029]进一步,所述步骤四的慢任务备份条件:未在进程上失败过的task;没有备份过的task;Task所占用的资源量大;属于慢任务。[0030]综上所述,本发明的优点及积极效果为:[0031]针对现有的改进算法中结合加权轮转算法的思想,避免单个高权值worker节点负载过高,以及大的task任务直接被丢弃的问题进行改进。首先将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;并动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小,再通过与task分类情况进行映射至各个worker节点,再进行task任务的调度。通过计算Worker节点的权值,能够更好的区分Worker节点的计算能力,再将task分类后与Worker节点进行映射更能充分利用资源,解决弱节点负载过高,强节点负载过低的问题。节省了任务运行时间,提高了资源利用率。[0032]附图说明[0033]图1是本发明实施例提供的基于负载均衡机制的权重优先Task任务调度方法流程图。[0034]图2是本发明实施例提供的结合加权轮转算法的思想,对worker节点进行权值的计算示意图。[0035]图3是本发明实施例提供的在原有模型上加入分布式负载均衡框架示意图。[0036]图4是本发明实施例提供的TaskWorker映射方式示意图。具体实施方式[0037]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。[0038]如图1所示,本发明实施例提供的基于负载均衡机制的权重优先Task任务调度方法包括以下步骤:[0039]S101:将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;[0040]S102:动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小;[0041]S103:通过与task分类情况进行映射至各个worker节点,再进行task任务的调度。[0042]下面结合附图对本发明的应用原理作进一步的描述。[0043]本发明实施例提供的基于负载均衡机制的权重优先Task任务调度方法具体包括以下步骤:[0044]1.首先将task任务按照读取速度及占用资源量的大小进行分类:[0045]分为占用数据量小且读取速度快、占用数据量小且读取速度慢、占用数据量大且读取速度快、占用数据量大且读取速度慢四类。[0046]其中判断task任务大小的方法:[0048]判断task任务是否为慢任务的方法:[0049]—个进程上Task平均进度增长率-所以进程上Task平均任务增长率X慢节点阈值⑵[0050]2.其次结合加权轮转算法的思想,对worker节点进行权值的计算:如图2:[0051]其中,⑶代表:CPU的利用率;MU代表:内存利用率;WCL代表:单个worker节点上负载的队列长度;capacity代表:该worker节点的权值;count代表:权值计算过程中的计算次数;[0052]其中,CPU利用率的计算方法:[0054]内存利用率的计算方法:[0057]其中,EiS表示内存总量;MU瓣ii用表示目前可以使用的内存容量;MFree表示空闲内存容量;Mc^he表示缓存容量。[0058]单个worker节点上负载的队列长度计算方法:[0060]其中,WTask表示该worker机上负载task的数量;总Task表示正在运行的task的数量;W植表示该worker机的权值;总植表示所有worker机的总权值。若满足公式⑸的条件,贝Ij为单个worker节点的负载阈值。[0061]3.然后在原有模型上加入分布式负载均衡框架:如图3;[0062]4.最后将计算出的worker节点上的权值和task分类后的情况进行映射;并且worker权值为O的节点不进行分配,且占用数据量大且读取速度慢类型的task直接进行慢任务备份,并等待权值最大的worker节点进行分配:[0063]慢任务备份条件:[0064]1未在进程上失败过的task[0065]2没有备份过的task[0066]3Task所占用的资源量大[0067]⑷属于慢任务,见公式⑵[0068]TaskWorker映射方式如图4。[0069]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述基于负载均衡机制的权重优先Task任务调度方法包括:将task任务进行分类,以task任务读取速度和占用资源量的大小两个条件,将task任务分为四类;在各个worker节点上加入负载均衡模块,使之成为分布式负载均衡模型;并动态监测各worker节点上的资源使用和负载情况,在master节点上根据权值的大小,再通过与task分类情况进行映射至各个worker节点,再进行task任务的调度。2.如权利要求1所述的基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述基于负载均衡机制的权重优先Task任务调度方法包括以下步骤;步骤一,将task任务按照读取速度及占用资源量的大小进行分类;步骤二,结合加权轮转算法的思想,对worker节点进行权值的计算;步骤三,在原有模型上加入分布式负载均衡框架;步骤四,将计算出的worker节点上的权值和task分类后的情况进行映射;并且worker权值为〇的节点不进行分配,且占用数据量大且读取速度慢类型的task直接进行慢任务备份,并等待权值最大的worker节点进行分配。3.如权利要求2所述的基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述步骤一具体包括:分为占用数据量小且读取速度快、占用数据量小且读取速度慢、占用数据量大且读取速度快、占用数据量大且读取速度慢四类;其中判断task任务大小的方法:节点个数ΐ判断task任务是否为慢任务的方法:一个进程上Task平均进度增长率-所以进程上Task平均任务增长率慢节点阈值。4.如权利要求2所述的基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述步骤二具体包括:CU代表:CPU的利用率;MU代表:内存利用率;WCL代表:单个worker节点上负载的队列长度;capacity代表:该worker节点的权值;count代表:权值计算过程中的计算次数;其中,CRJ利用率的计算方法:内存利用率的计算方法:其中,Mg量表示内存总量;MU势何用表示目前可以使用的内存容量;MFree表示空闲内存容量;Mc^hf3表示缓存容量;单个worker节点上负载的队列长度计算方法:其中,WTask表示该worker机上负载task的数量;总Task表示正在运行的task的数量;Im直表示该worker机的权值;总《直表示所有worker机的总权值。5.如权利要求2所述的基于负载均衡机制的权重优先Task任务调度方法,其特征在于,所述步骤四的慢任务备份条件:未在进程上失败过的task;没有备份过的task;Task所占用的资源量大;属于慢任务。

百度查询: 重庆邮电大学 基于负载均衡机制的权重优先Task任务调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。