%0 Journal Article %T 基于DiffNodeset结构的最大频繁项集挖掘算法 %A 张昌 %A 文凯 %A 郑云俊 %J 计算机应用 %D 2018 %R 10.11772/j.issn.1001-9081.2018040913 %X 摘要 在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果 %K 最大频繁项集挖掘 %K 关联规则 %K 集合枚举树 %K 优化剪枝 %K 超集检测 %U http://www.joca.cn/CN/abstract/abstract22727.shtml