%0 Journal Article %T 基于MapReduce的数据流频繁项集挖掘算法<br>An algorithm for mining frequent item sets from data streams based on MapReduce %A 朱付保 %A 白庆春 %A 汤萌萌 %A 朱颢东< %A br> %A ZHU Fubao %A BAI Qingchun %A TANG Mengmeng %A ZHU Haodong %J 华中师范大学学报(自然科学版) %D 2017 %X 针对传统数据流频繁项集计算中效率低、内存消耗大等问题,本文采用并行计算的思想设计了一种基于MapReduce的数据流频繁项集挖掘算法,首先,对进行数据分块压缩和传输,其次,将数据频繁项的计算分布在负载均衡的数据节点,可以有效保证数据的执行效率.最后通过一次调度处理合并各个节点产生的频繁项集并进行合并.理论分析和实验对比结果均表明,该算法对于并行处理数据流频繁项集的统计问题是有效可行的.<br %K MapReduce %K 频繁项集 %K 数据流 %K 并行计算 %K 数据挖掘 %K < %K br> %K MapReduce %K item sets %K data streams %K parallel computation %K data mining %U http://journal.ccnu.edu.cn/zk/CN/abstract/abstract7966.shtml