买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东北大学
摘要:本发明公开了一种基于LAC‑FLOSS算法和IER算法的时间序列分割方法,涉及时间序列数据分割方法。本发明提出了改进的基于MatrixProfile的限制弧跨越的时间序列分割算法LAC‑FLOSS,该算法利用给弧添加权重形成带权弧,然后通过设置匹配距离阈值来解决弧的跨状态的子序列误匹配问题。本发明还利用CAC序列的形状特征,从波谷中提取极小值,进而提出改进的提取分割点算法IER。该算法能够避免现有的分割点提取算法ER使用窗口在非拐点处取到分割点,提升提取分割结果的准确性,通过与ER算法进行对比,验证了IER提取分割点的效果要优于算法ER。
主权项:1.一种基于LAC-FLOSS算法和IER算法的时间序列分割方法,其特征在于,该方法包括如下步骤:步骤1:计算时间序列T中长度为m的任一子序列Q与时间序列T中其他等长度的子序列Ti,m对应的距离轮廓,获得距离轮廓集合;步骤2:根据距离轮廓集合,计算子序列Q和时间序列T的矩阵轮廓MP和矩阵轮廓索引MPI;步骤3:根据步骤1计算出的距离轮廓给每条弧添加权重,获得每个带权弧,进而获得Q序列的带权弧跨越序列WAC;根据步骤1计算出的距离轮廓给每条弧添加权重获得每个带权弧WACi的计算公式如下: 其中,DPi表示查询子序列Q和时间序列T中索引为i、长度为m的子序列对应的距离轮廓;Idxcur表示当前查询子序列Q的索引;i表示时间序列T中被匹配到的子序列的起始索引;n为时间序列T的长度;WACi则表示Q序列与时间序列T中起始索引为i、长度为m的子序列之间形成的带权弧;步骤4:首先确定时间序列T的匹配距离阈值,然后从当前MatrixProfile对应索引i的子序列开始,遍历时间序列T中的所有子序列,遍历过程中根据匹配距离阈值依次判断每一个子序列是否需要重算弧指向,若当前子序列Q与其所指向子序列之间的距离大于匹配距离阈值,则需要转至步骤5重新计算当前子序列的弧指向,在所有子序列遍历完成后转至步骤6;所述匹配距离阈值的确定方法为:以时间序列T的长度除以时间序列T中状态的数目得到的值作为时间序列T的匹配距离阈值;步骤5:计算当前子序列Q和时间序列T中除了子序列Q外的所有子序列的WAC,共同构成WAC集合,并对WAC集合中的元素进行升序排序,选取当前子序列对应的WAC集合中带权弧不大于匹配距离阈值的最大带权弧作为最优弧,从而对匹配弧、最近邻和最近邻索引进行更新,进而矩阵轮廓MP和矩阵轮廓索引MPI得到更新,返回步骤4继续遍历后继子序列;步骤6:根据更新的矩阵轮廓MP和矩阵轮廓索引MPI,使用FLOSS算法计算时间序列T对应的弧跨越数序列CAC;步骤7:对步骤6得到的CAC序列进行平滑降噪处理;步骤8:确定CAC序列中波谷的选取阈值,并根据该选取阈值确定CAC序列中波谷的极小值集合;所述确定CAC序列中波谷的选取阈值的方法是按照如下计算公式进行计算确定:dist=numRegimes2其中,dist为CAC序列中波谷的选取阈值;n为时间序列T的长度,numRegimes为时间序列T中活动状态数;步骤9:确定CAC序列中波谷的极小值集合中每个极小值对应的索引,从而获得分割点的集合,完成时间序列的分割。
全文数据:
权利要求:
百度查询: 东北大学 一种基于LAC-FLOSS算法和IER算法的时间序列分割方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。