Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种机器学习工作流构建方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明公开了一种机器学习工作流构建方法,包括以下步骤:步骤1、构建算子,包括如下子步骤:步骤11、定义数据加载算子;步骤12、定义kmeans聚类模型算子;步骤13、数据标注及类别平衡处理算子的定义;步骤14、构建决策树分类模型算子;步骤15、模型预测算子的定义;步骤2、定义算子之间的连接和依赖关系,定义一个有向无环图DAG,其中节点代表算子,边代表算子之间的依赖关系;步骤3、编译工作流;步骤4、执行工作流,训练模型;步骤5、提交计算任务。本发明通过复用已有的工作流模板,建模人员可以快速构建新的工作流,减少重复劳动。

主权项:1.一种机器学习工作流构建方法,其特征在于,包括以下步骤:步骤1、构建算子,包括如下子步骤:步骤11、定义数据加载算子:数据加载算子使用@component作为装饰器,定义了一个名称为load_data的函数;@component放置于定义函数上方,能够定义函数的计算逻辑、接口、元数据;步骤12、定义kmeans聚类模型算子:kmeans算子的功能是根据数据加载算子加载的电潜泵工作数据,使用kmeans聚类模型将数据聚类为3类:正常、故障、失效,同时将聚类结果输出到MinIO存储;算子函数中输出变量到MinIO存储有两种不同的方式:一种是输出为Output类型,写法为:‘输出变量名:Output[输出数据类型]’;另一种是输出为OutputPath类型,写法为:‘输出变量名:OutputPath[输出数据类型]’;步骤13、数据标注及类别平衡处理算子的定义:使用oversample算子将Kmeans模型聚类结果作为类别标签,统计聚类结果,通过上采样的方式平衡各个类别的数据;同时按预设的比例将数据划分为训练集和测试集,并保存在MinIo中;步骤14、构建决策树分类模型算子:采用decisionTree算子将数据平衡后的聚类结果作为类别标签,构建decisionTree分类模型,并利用训练集数据进行训练;对训练好的模型进行存储,并记录模型的元数据,包括:模型大小,名称,计算框架;步骤15、模型预测算子的定义:使用predict算子,加载上一步保存的模型文件以及测试集,使用模型针对测试数据进行预测和泛化性能的测试,计算准确率的得分,输出混淆矩阵;混淆矩阵'contrusion_mat'以artifacts输出,格式为“confusion_mat.log_confusion_matrix类别列表:混淆矩阵列表”;混淆矩阵中的元素0、2、1分别与电潜泵对应的状态“Normal"、”Fault"、"Shut_down"对应,分别表示正常、故障、失效三种状态;步骤2、定义算子之间的连接和依赖关系,定义一个有向无环图DAG,其中节点代表算子;边代表算子之间的依赖关系,通过指定一个算子的输出作为另一个算子的输入来实现;步骤3、编译工作流,确保工作流能被正确解析和执行,将定义好的工作流保存为文件;步骤4、执行工作流,训练模型;步骤5、提交计算任务,根据需要运行工作流,每次运行时,需填写工作流参数,填写完相关信息,将定义好的工作流提交到Kubernetes集群,使用kubectl命令行工具或工作流引擎提供的API来创建相应的Kubernetes资源对象。

全文数据:

权利要求:

百度查询: 电子科技大学 一种机器学习工作流构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。