买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学技术大学
摘要:本发明公开了一种集群资源配额管理方法、系统、设备及存储介质,基于设计的自定义指标可以记录任务的资源使用量,如存储、内存、CPU和GPU资源等,解决了在多维度层面群组、个人设置资源配额的问题,以及为不同类型的GPU设置资源配额的问题,实现高效资源配额管理。并且,普罗米修斯监控工具的时序数据库可以记录用户和群组已用配额的时序变化信息,因此本发明能够获取最近一段时间用户和群组使用资源量的变化情况,从而更有效的监控集群资源的使用情况。此外,本发明易于拓展,可以支持更多类型GPU的配额控制。
主权项:1.一种集群资源配额管理方法,其特征在于,包括:存储各群组的群组资源配额,各用户所在群组的个人资源配额,以及各任务的信息;对于当前待调度的任务,进行配额检查:根据当前待调度任务的信息确定对应的用户编号和群组编号,并结合对应的个人资源配额与群组资源配额以及通过普罗米修斯监控工具获得的信息,确定个人和群组剩余资源配额,若个人和群组剩余配额满足当前待调度的任务的资源需求,则通过配额检查,利用任务的信息生成对应的自定义指标;将任务的所有自定义指标推送至Pushgateway,并调用应用程序编程接口创建对应的Pod,Pod被K8s调度后会从资源池中分配资源并运行;其中,每个任务产生多个自定义指标,每一自定义指标对应一种资源类型,产生的多个自定义指标具有若干相同的标签,用于标识任务的基本信息,并配置有不同的资源类型标签,通过所有资源类型标签来标识任务的资源需求;时刻监听所有Pod的状态变化情况,当任务对应的Pod正常完成、失败或被删除时Pod占用的资源会被释放,并触发回调函数,删除Pod对应任务在Pushgateway中的所有自定义指标,普罗米修斯监控工具将无法再查询到这些指标,任务所占用的个人和群组的资源配额随即相应恢复。
全文数据:
权利要求:
百度查询: 中国科学技术大学 集群资源配额管理方法、系统、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。