Parallel Algorithm for Mining Maximal Frequent Itemsets
挖掘最大频繁项集的并行算法
Keywords: 频繁项集,并行算法,等价类,数据库,处理机,数据挖掘,负载平衡,因子,表示,包含关系
Abstract:
频繁项集的挖掘是数据挖掘的核心内容。本文提出挖掘最大频繁项集的并行算法P-MinMax,它采用数据库的垂直表示和基于前缀关系的等价类划分,利用因子项集的完全包含关系在处理机之间贪心分配等价类,根据等价类的需要相应地划分和有选择地复制数据库记录,使各处理机得以异步计算,达到了较好的负载平衡。分析和实验表明,
Full-Text