|
计算机科学 2015
基于bigtable与mapreduce的apriori算法改进Keywords: apriori算法,bigtable,mapreduce,大数据 Abstract: 为提高apriori算法挖掘频繁项目集的效率,引进了bigtable技术与mapreduce模型来对apriori算法进行优化,设计出大数据环境下挖掘频繁项目集的新算法bm-apriori算法。与单纯基于mapreduce模型的apriori改进算法相比,新算法利用bigtable的时间戳属性代替了键/值对的产生,只需扫描数据库一次即可,节约了模式匹配的时间。同时,bm-apriori算法在项集列表中新增事务标号列,自动获取事务标号以计算支持度。将bm-apriori算法在hadoop平台上进行了实验,结果表明bigtable技术的融入使得bm-apriori算法具有更高的效率与可拓展性。
|