买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于时间序列聚类和深度学习LSTM的云服务器老化预测方法。对云服务器上性能资源时间序列数据进行提取,包括CPU空闲率数据和系统可用内存数据;对时间序列数据进行小波包分解预处理;对预处理后的数据进行K‑means聚类,统计出现频次最高的聚类中心,利用聚类后的结果构建深度学习LSTM模型,根据LSTM模型的时间序列预测值对软件老化趋势进行预测,本发明利用小波包分解克服了传统预测方法对非平稳时间序列数据和波动较大的时间序列数据预测准确度较低的局限性,从而能够更精确地预测软件老化趋势。解决了针对云服务器软件老化现象如何在最佳的时间点进行软件再生的问题。
主权项:1.基于时间序列聚类和深度学习LSTM的云服务器老化预测方法,具体包括以下步骤:步骤1,提取云服务器上CPU空闲率和系统可用内存时间序列数据;步骤2,对步骤1的数据进行三层小波包分解预处理,首先对云服务器资源数据进行预处理,对数据进行频域分析;频域分析采用三层小波包分解技术,通过三层小波包分解对时间序列进行更加精细的分析,它将时间序列进行多层次划分,对每个分解后的频带进行再次划分;并且根据被分析时间序列的特征选择相应频带,对时间序列数据进行特征聚类;步骤3,对步骤2预处理后的数据进行K-means聚类并根据DBI指标评价聚类结果;采用K-means聚类算法对云服务器资源的时间序列数据进行多次聚类,K-means算法用欧式距离表示数据之间的差异,通过直接求均值来计算聚类的中心点,其步骤如下:步骤3.1,选择初始聚类中心点m1,m2,…,mk,…,mN;步骤3.1中,选择初始聚类中心点使用K-means++方法,其思想可以描述为:在选取第一个聚类中心n=1时通过随机的方法,假设已经选取了n个初始聚类中心0nK,则在选取第n+1个聚类中心时,距离当前n个聚类中心越远的点会有更高的概率被选为第n+1个聚类中心;步骤3.2,将其他对象分配到与其距离最小的中心点所在的类;步骤3.3,按照欧式距离的平均值最小的原则更新每个聚类的中心点;步骤3.4,重复步骤3.2、步骤3.3,直至算法K-means收敛;步骤4,对步骤3中得到的聚类结果建立LSTM模型并进行模型训练和预测;利用聚类后得到的结果构建深度学习LSTM模型,其具体步骤如下:步骤4.1,提取重负载阶段和宕机临界阶段的时间序列数据并转化,将云服务器资源时间序列数据进行数值化;步骤4.1中,经过步骤3聚类得到四种类别的时间序列数据,分别为初始阶段、轻负载阶段、重负载阶段和宕机临界阶段,其中初始阶段和轻负载阶段都为云服务器都处于正常、良好运行的状态,所以只需要针对出现老化迹象的重负载阶段和系统接近崩溃的宕机临界阶段进行预测;步骤4.2,生成模型训练数据集,确定训练集的窗口长度;步骤4.3,网络模型结构和参数的确定和调整;步骤4.3中,网络的模型结构确定涉及到许多参数的调整,包括需要确定LSTM模块的激活函数、确定接收LSTM输出的完全连接人工神经网络的激活函数、为了防止过度拟合需要确定每一层网络节点的舍弃率、确定误差的计算方式、确定权重参数的迭代更新方式、确定模型训练的epoch和batchsize等参数;步骤4.4,模型训练和结果预测;步骤4.4中,为了防止过度拟合,将云资源时间序列数据按4:1的比例随机拆分为训练集和验证集训练模型,然后将时间序列数据作为参数导入模型便可得到预测时间序列数据,与实际的云资源时间序列数据相比便可得到拟合曲线;步骤5,用均方根误差和平均绝对百分比误差函数,验证步骤4中的云服务器资源时间序列预测值与原始时间序列的预测精确度;步骤6,检验LSTM模型预测时间序列和实际时间序列的拟合程度,根据云服务器资源时间序列预测数据,对软件老化趋势进行分析并判定最佳的软件再生时间点;步骤6中,检验LSTM模型预测数据与原始数据的拟合程度,当云服务器资源预测时间序列显示处于宕机临界状态下,此时CPU空闲率和系统可用内存在0%~10%之间,云服务器运行负载压力极大,系统随时可能出现宕机现象,选择在此时进行软件再生操作,以保持系统处于正常、良好运行的状态。
全文数据:
权利要求:
百度查询: 西安理工大学 基于时间序列聚类和LSTM的云服务器老化预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。