买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了一种处理极端不平衡数据的磁盘故障预测方法及装置,方法包括获取磁盘的日志数据,并对磁盘的日志数据进行预处理;基于预设时间间隔对经过预处理后的磁盘的日志数据进行划分处理,并从经过划分处理后的磁盘的日志数据中提取出第一特征集合;基于密度聚类算法对第一特征集合进行聚类处理,并对经过聚类处理后的第一特征集合进行欠采样处理,得到第二特征集合;根据第二特征集合预测出磁盘在下一时刻的特征集合,并基于磁盘在下一时刻的特征集合确定出磁盘的故障信息。通过在极端不平衡数据下学习磁盘发生故障的规律,并在真实生产环境中较为精确地对磁盘故障进行预测,从而提高运维工作的计划性。
主权项:1.一种处理极端不平衡数据的磁盘故障预测方法,其特征在于,包括:获取磁盘的日志数据,并对所述磁盘的日志数据进行预处理;基于预设时间间隔对经过预处理后的所述磁盘的日志数据进行划分处理,并从经过划分处理后的所述磁盘的日志数据中提取出第一特征集合;基于密度聚类算法对所述第一特征集合进行聚类处理,并对经过聚类处理后的所述第一特征集合进行欠采样处理,得到第二特征集合;根据所述第二特征集合预测出磁盘在下一时刻的特征集合,并基于所述磁盘在下一时刻的特征集合确定出磁盘的故障信息;其中,所述从经过划分处理后的所述磁盘的日志数据中提取出第一特征集合,包括:从与每个时间间隔对应的所述磁盘的日志数据中确定出属于相同属性的特征值,并按照预设权重以及每个所述属于相同属性的特征值,计算出每个属性的权重特征值;从任意两个连续时间间隔所对应的所述磁盘的日志数据中分别确定出属于相同属性的特征值,并对两个所述属于相同属性的特征值进行差值计算,计算出每个属性的差值特征值;将所述每个属性的权重特征值以及所述每个属性的差值特征值作为第一特征集合;其中,所述基于密度聚类算法对所述第一特征集合进行聚类处理,并对经过聚类处理后的所述第一特征集合进行欠采样处理,得到第二特征集合,包括:基于密度聚类算法对所述第一特征集合进行聚类处理,得到至少两个类簇;其中,每个所述类簇包括至少两个特征值;对所述第一特征集合中所述至少两个类簇所包括的所有特征值进行剔除处理,得到第三特征集合;按照预设比例对所述至少两个类簇以及所述第三特征集合进行合并处理,得到第二特征集合;其中,所述根据所述第二特征集合预测出磁盘在下一时刻的特征集合,包括:将所述第二特征集合输入至训练后的第一神经网络中,预测出故障磁盘所对应的特征集合;确定出与所述故障磁盘所对应的特征集合的数量一致的样本特征集合,并按照预设时刻间隔对所述故障磁盘所对应的特征集合以及所述样本特征集合进行划分处理;将经过划分处理后的所述故障磁盘所对应的特征集合以及所述样本特征集合进行编码处理,并将经过编码处理后的所述故障磁盘所对应的特征集合以及所述样本特征集合输入至训练后的第二神经网络中,预测出磁盘在下一时刻的特征集合。
全文数据:
权利要求:
百度查询: 天翼云科技有限公司 一种处理极端不平衡数据的磁盘故障预测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。