深度学习算力虚拟化系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：上海熠知电子科技有限公司

摘要：本发明提供了一种深度学习算力虚拟化系统，包括：深度学习虚拟化平台，被配置为将虚拟化的所有资源进行汇总，根据汇总的资源将业务请求分配至深度学习服务器；以及深度学习服务器，被配置为通过本地算力聚合及任务分配系统将任务分配至其内部的各个深度学习单元，以使各个深度学习单元能够处理任务；其中各个深度学习单元的算力被聚合在本地算力聚合及任务分配系统中。

主权项：1.一种深度学习算力虚拟化系统，其特征在于，包括：深度学习虚拟化平台，被配置为将虚拟化的所有资源进行汇总，根据汇总的资源将业务请求分配至深度学习服务器；以及深度学习服务器，被配置为通过本地算力聚合及任务分配系统将任务分配至其内部的各个深度学习单元，以使各个深度学习单元能够处理任务；其中各个深度学习单元的算力被聚合在本地算力聚合及任务分配系统中，其中所述本地算力聚合及任务分配系统包括：本地模型池，被配置为对接深度学习虚拟化平台的总模型池；运算任务请求接口，被配置为与深度学习虚拟化平台对接任务和处理结果；模型管理器，被配置为在底层计算硬件上加载模型实例；任务调度器，被配置为将运算任务送往底层计算硬件上的模型实例进行计算，以及将运算任务拼成批；以及状态采集器，被配置为采集本深度学习服务器的算力总资源、当前算力占用比例、任务处理速度、队列种类及队列等待长度，上报深度学习虚拟化平台，其中所述深度学习虚拟化平台还被配置为：统计业务请求到达的形态和规律，根据业务请求到达的形态和规律，智能预控制整个深度学习服务器集群的状态、以及预设置整个深度学习服务器集群的参数，以应付对该业务请求的形态和规律的预测；将业务请求下发至深度学习服务器时，进一步明确处理延时的要求和吞吐率的要求，所述业务请求到达的形态和规律包括：单流类业务请求，其业务请求以流的形式到达，且单次到达的样本数为1；多流类业务请求，其业务请求以流的形式到达，且单次到达多个样本；服务器类业务请求，业务请求随机到达；以及离线类业务请求，其所有业务请求和样本数据均批量到达；各类业务请求对运算完成时限的敏感度排序为：单流类业务请求和多流类业务请求大于服务器类业务请求，服务器类业务请求大于离线类业务请求，在单流类业务请求和多流类业务请求的应用场景下，深度学习虚拟化平台根据预先的业务设定情况，使得各深度学习服务器的调度按照既定策略进行静态分配，定期跟踪业务设定情况的变化；预先的业务设定情况包括：各业务请求到达的间隔时间，预期需要完成业务请求的时限要求，单次到达的样本数量，以及需加载的模型实例种类；所述既定策略包括：根据业务设定情况，一次性将所需的计算资源静态分配给各业务请求使用，并定时跟踪计算资源的耗用情况及运算完成的时限情况，如果出现业务未按照规律抵达或计算资源耗用异常，则作为故障上报，在服务器类业务请求的应用场景下，实时统计业务到达的具体情况、以及待处理任务的队列长度，得到业务到达规律的统计结果；根据对业务到达规律的统计结果在底层计算硬件上采用动态方式加载模型实例；当针对某模型实例的计算请求等候队列的任务数量大于第一阈值且持续时间超出第二阈值，则从底层计算硬件上多加载1个模型实例，若任务数量持续大于第一阈值，则继续加载模型实例，直至恢复到正常业务吞吐水平；当针对某模型实例的计算请求等候队列的任务数量小于第三阈值且持续时间超出第四阈值，则从底层计算硬件上释放1个模型实例，若任务数量持续小于第三阈值，则逐步减少模型实例，直至在正常业务吞吐水平下计算资源利用率达到预设水平，在离线类业务请求的应用场景下，若预期的处理时间通过人为预订，则根据预期的处理时间和此刻计算资源的可用程度，一次性并行加载指定数量的模型实例，同时结合批加快运算处理。

全文数据：

权利要求：

百度查询：上海熠知电子科技有限公司深度学习算力虚拟化系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：代码大模型的代码生成方法、装置、电子设备及介质

下一篇：云资源消耗优化方法、装置、计算机设备及存储介质

相关技术

代码大模型的代码生成方法、装置、电子设备及介质

云资源消耗优化方法、装置、计算机设备及存储介质

一种含有人参提取物的美白保湿抗衰老多效面霜及其制备方法

一种铁基层状氧化物钠离子电池正极材料及其制备方法和应用

利用率结构分布评估方法、装置、设备、介质及产品

列车完整性防护方法、装置、线路控制器和存储介质

致动器、摄像模组及电子设备

车载装置

获取剥离预测模型的方法及图形修正的方法

触摸输入装置

提升含风电储能电池的虚拟电厂二次调频性能的控制方法

一种复方降三高药膳及其制备方法

虚拟化相关技术

一种虚拟化管理下的相机调用方法、装置、车辆及介质_亿咖通(湖北)技术有限公司_202210770377.X

虚拟化融合网元内部接口消息采集方法及装置_中国移动通信集团设计院有限公司_202410456033.0

虚拟对象互动系统_北京百度网讯科技有限公司_202323455647.7

固态硬盘的多虚拟机负载的自动化测试方法、装置、系统_苏州浪潮智能科技有限公司_202210468944.6

中断虚拟化实时处理方法、装置、存储介质和终端_中汽创智科技有限公司_202111199556.4

虚拟现实装置_浙江舜宇光学有限公司_202323623897.7

虚拟电厂的控制装置_丰田自动车株式会社_202110569389.1

虚拟现实设备检测装置和虚拟现实设备检测平台_北京东舟技术股份有限公司_202323528464.3

在交通工具中运行虚拟现实眼镜的方法以及包括虚拟现实眼镜和交通工具的虚拟现实系统_奥迪股份公司_202080063218.5

一种虚拟机虚拟网络架构、控制方法和数据传输方法_麒麟软件有限公司_202410872380.1

算相关技术

算力资源调度算力资源调度方法、装置及系统_中国移动通信集团广东有限公司_202410697591.6

算力负载预测与算力调度方法、装置、设备、介质及产品_中国移动通信有限公司研究院_202410215852.6

算力重构配置方法及装置_中国移动通信集团浙江有限公司_202410669317.8

算力处理方法及装置_中国移动通信集团浙江有限公司_202311257400.6

深度学习算力虚拟化系统_上海熠知电子科技有限公司_202110962779.5

考虑算力约束的算力中心储备一体电池规划方法及装置_清华大学_202410776774.7

算力调度方法、装置、设备及存储介质_中国移动通信有限公司研究院_202311760216.3

算力路由方法、装置、设备及介质_中移(杭州)信息技术有限公司_202311377499.3

算力网络的无损传输方法和设备_中国移动通信集团黑龙江有限公司_202310843131.5

算力调度方法、装置、设备及存储介质_中国移动通信集团广东有限公司_202410656593.0

学习相关技术

便携式学习设备_安徽淘云科技股份有限公司_202420290415.6

一种基于组级学习的缓存学习方法及系统_齐鲁工业大学(山东省科学院)_202410946509.9

联邦学习引擎对齐方法、联邦学习方法、装置及电子设备_中国移动通信有限公司研究院_202311064712.5

一种基于儿童学习偏好和智能教练的自适应学习方法_珠海谷田科技有限公司_202411254196.7

基于深度学习与联邦学习的短期光伏发电预测方法及系统_江苏润和软件股份有限公司_202410880025.9

一种图学习装置构建方法及图学习方法_中国科学院计算技术研究所_202410883106.4

聚类联邦学习框架下的主动学习客户选择方法和装置_中国人民解放军国防科技大学_202210283551.8

深度学习算力虚拟化系统_上海熠知电子科技有限公司_202110962779.5

智能物理学习辅助系统_昌黎开放大学_202411066572.X

一种基于小样本学习的数据增强和可学习参数的阈值损失优化方法_北京中科通量科技有限公司_202411013608.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

深度学习算力虚拟化系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务