首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

分布式训练方法、装置和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:摩尔线程智能科技(北京)有限责任公司

摘要:本公开涉及一种分布式训练方法、装置和存储介质。该方法包括:获取一个或多个节点的硬盘信息,基于硬盘信息确定一个或多个节点的硬盘状态;响应于存在硬盘状态满足预设条件的第一节点,针对第一节点上的训练任务生成检查点文件,检查点文件中包括与训练任务关联的状态信息;停止执行第一节点上的训练任务,使第二节点基于检查点文件继续执行训练任务,第二节点为一个或多个节点中硬盘状态不满足预设条件的节点。根据本申请实施例,可以实现将训练任务由故障节点迁移至健康节点上继续执行,使硬盘存在故障时,训练任务可以在不同节点间的无缝切换,而无需重新执行训练任务,节约了训练时间,避免了处理器资源浪费。

主权项:1.一种分布式训练方法,其特征在于,所述方法包括:获取一个或多个节点的硬盘信息,基于所述硬盘信息确定所述一个或多个节点的硬盘状态;响应于存在所述硬盘状态满足预设条件的第一节点,针对所述第一节点上的训练任务生成检查点文件,所述检查点文件中包括与所述训练任务关联的状态信息;停止执行所述第一节点上的训练任务,使第二节点基于所述检查点文件继续执行所述训练任务,所述第二节点为所述一个或多个节点中硬盘状态不满足预设条件的节点。

全文数据:

权利要求:

百度查询: 摩尔线程智能科技(北京)有限责任公司 分布式训练方法、装置和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。