买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:齐鲁工业大学(山东省科学院)
摘要:本发明公开了一种重复负序列模式挖掘方法,涉及数据挖掘技术领域。本申请所述的重复负序列模式挖掘方法无需借助先验经验来确定初始支持度阈值,只需将初始支持度阈值设置为0,即可进行重复负序列模式挖掘;而且,本申请中通过始终动态提升最小支持度Min‑sup、自动识别并挖掘支持度最高的前K个重复负序列模式以及在步骤S3中创新性的设计了一种针对重复负序列候选模式进行重复负序列模式搜索的步骤,使得本申请能够快速地完成TOP‑K重复复序列模式的挖掘任务。
主权项:1.一种重复负序列模式挖掘方法,其特征在于:包括以下步骤:S1、遍历数据库,获取数据库中出现的所有的单项并建立位图;S2、创建一个大小为K的小顶堆TOP-Minheap用于存放当前支持度最高的前K个重复负序列候选模式;创建一个大顶堆SC-Maxheap用于存放当前产生且未被遍历的重复序列候选模式;将所有单项分别封装为元素作为重复序列候选模式,而后,根据位图计算相应的重复序列候选模式的支持度,并将重复序列候选模式及其相应的支持度存入大顶堆SC-Maxheap;S3、从大顶堆SC-Maxheap中选择支持度最大的重复序列候选模式作为当前扩展序列模式,对当前扩展序列模式进行模式生成,并对模式生成产生的新的重复序列候选模式进行模式搜索和支持度计算;S4、判断步骤S3中得到的新的重复负序列候选模式的支持度是否大于当前最小支持度Min-sup,当大于当前最小支持度Min-sup时,则将该上述新的重复负序列候选模式及其支持度输送至大顶堆SCMax-heap和小顶堆TOP-Minheap中,并对大顶堆SCMax-heap和小顶堆TOP-Minheap分别进行更新,并使用小顶堆TOP-Minheap内支持度最小的模式的支持度作为新的当前最小支持度Min-sup;S5、重复步骤S3和步骤S4,直至满足下述终止条件中的其中一个终止循环过程;所述终止条件包括:1、小顶堆TOP-Minheap中存放当前支持度最高的前K个重复负序列候选模式,并且大顶堆SCMax-heap中堆顶模式的支持度小于等于当前最小支持度Min-sup;2、大顶堆SCMax-heap为空,大顶堆SCMax-heap为空是指大顶堆SCMax-heap中不存在序列候选模式;S6、输出终止循环过程后的小顶堆TOP-Minheap中所有的重复负序列候选模式作为TOP-K重复负序列模式集合。
全文数据:
权利要求:
百度查询: 齐鲁工业大学(山东省科学院) 一种重复负序列模式挖掘方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。