|
软件学报 2005
快速挖掘全局最大频繁项目集, PP. 553-560 Keywords: 分布式数据库,数据挖掘,频繁模式树,全局最大频繁项目集 Abstract: 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法fmgmfi(fastminingglobalmaximumfrequentitemsets),该算法采用fp-tree存储结构,可方便地从各局部fp-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,fmgmf算法是有效、可行的.
|