首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于AI服务器冗余系统的数据源故障处理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:四川华鲲振宇智能科技有限责任公司

摘要:本发明属于AI数据源异常处理技术领域,具体涉及基于AI服务器冗余系统的数据源故障处理方法及系统,启动服务器时对其CPU系统中各CPU的状态参数进行检测,并以最佳优先级执行;实时监测当前运行CPU的状态,判断其是否异常,并切换至匹配的CPU,根据匹配结果更新当前优先级;匹配的CPU的DIMM内存条下发算法指令在匹配的CPU的NPU模组上重新计算;实时监测NPU的状态参数,执行最佳优先级;实时监测当前运行的各NPU状态,判断是否异常,执行最佳优先级;CPU将数据源下发给到匹配的NPU多计算一份,CPU再将解析后的数据源保存数据于NVMe盘。有效保障数据源不会随意丢失。

主权项:1.基于AI服务器冗余系统的数据源故障处理方法,其特征在于,包括以下步骤:S1:启动服务器时对各CPU的状态参数进行检测,并基于状态参数确定各CPU运行的CPU当前优先级,将CPU当前优先级与CPU默认优先级进行对比,判断是否一致,若是,执行步骤S2;若否,以CPU当前优先级运行,再执行步骤S2,同时将CPU当前优先级设为默认优先级;S2:CPU进行数据处理,并实时监测当前运行CPU的状态,判断其是否存在异常,若是,分析异常类型和处理的数据类型,根据异常类型和处理的数据类型匹配相应的CPU,并切换至匹配的CPU,根据匹配结果更新当前优先级;若否,继续执行CPU当前优先级;S3:匹配的CPU将异常CPU存储在异常CPU的NVMe盘中的计算数据源缓存到匹配的CPU的DIMM内存条中,并从匹配的CPU的DIMM内存条下发AI算法指令在匹配的CPU的NPU模组上重新计算;S4:实时监测匹配的CPU的NPU模组中各NPU的状态参数,并根据其状态参数确定匹配的CPU的NPU模组中NPU当前优先级,将NPU当前优先级与NPU默认优先级进行对比,判断是否一致,若是,执行步骤S5;若否,以NPU当前优先级运行,再执行步骤S5,同时将NPU当前优先级设置为默认优先级;S5:NPU模组进行数据处理,并实时监测当前运行的各NPU状态,判断是否存在异常,若是,分析异常类型和处理的数据类型,根据异常类型和处理的数据类型匹配相应的NPU,并根据匹配结果更新NPU当前优先级;匹配的CPU将在DIMM中静态缓存的AI计算数据源重新下发给到匹配的NPU,匹配的NPU多计算一份AI计算数据源,执行步骤S6;若否,继续执行NPU当前优先级,再执行步骤S6;S6:将计算完成后的数据模型解析发给匹配的CPU,匹配的CPU再将解析后的AI计算数据源缓存在DIMM内存条中,再保存数据于NVMe盘;S7:对异常CPU以及异常NPU进行维护,完成AI服务器的故障处理。

全文数据:

权利要求:

百度查询: 四川华鲲振宇智能科技有限责任公司 基于AI服务器冗余系统的数据源故障处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。