基于mapreduce的分布式etl多维数据模型研究
Keywords: etl,mapreduce,mdetl,维,事实
Abstract:
针对mapreduce缺少对etl上层数据模型的具体描述,提出了一种集成的基于mapreduce的分布式etl(mapreducedistributedetl,简称mdetl)多维数据模型处理方法其,把对数据的处理分解成对数据属性(维和事实)的处理,解决了etl上层具体数据模型的构建问题。用真实的数据集评估了它的性能,实验结果表明mdetl具有很好的可扩展性。
Full-Text