%0 Journal Article %T 基于间隔链表改进的频繁项集挖掘算法 %A 刘旭敏 %A 徐维祥 %J 计算机应用 %D 2016 %R 10.11772/j.issn.1001-9081.2016.04.0997 %X 摘要 针对PrePost算法中需要建立复杂的前序和后序编码树(PPC-tree)和节点链表(N-list)的问题,提出一种基于间隔链表(I-list)改进的高效频繁项集挖掘算法。首先,该算法采用了比频繁模模式树(FP-tree)更加压缩的数据存储结构间隔编码的频繁模式树(IFP-tree),无需迭代地建立条件FP-tree;其次,该算法利用更简洁的I-list代替了PrePost中复杂的N-list,从而提高了建树和挖掘速度;最后,对于单分支路径的情况,该算法通过组合的方法,直接求得某些频繁项集,以提高算法的时间性能。实验结果表明:一方面,对于同一数据集在相同支持数下挖掘的结果相同,验证了改进算法的正确性;另一方面,无论在时间还是空间上改进算法的整体性能均比PrePost算法提高约10%;且对于稀疏型数据库或密集型数据库的挖掘都有较好的应用 %K 数据挖掘 %K 关联规则 %K 频繁项集 %K 频繁模式树 %K 间隔链表 %U http://www.joca.cn/CN/abstract/abstract19158.shtml