OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

计算机科学 2011

Research on Parallel k-means Algorithm Design Based on Hadoop Platform
基于云计算平台Hadoop的并行k-means聚类算法设计研究

ZHAO Wei-zhong,MA Hui-fang,FU Yan-xiang,SHI Zhong-zhi,
赵卫中,马慧芳,傅燕翔,史忠植

Keywords: Cloud computing,Hadoop,Parallel k-means,MapReduce
云计算，Hadoop平台，并行k-means,MapReduce

Full-Text Cite this paper Add to My Lib

Abstract:

In the past decades, data clustering has been studied extensively and a mass of methods and theories have been achieved. However, with the development of database and popularity of Internet, a lot of new challenges such as massive data and new computing environment lie in the research on data clustering. We conducted a deep research on parallel k-means algorithm based onHadoop, which is a new cloud computing platform. We showed how to design parallel k-means algorithms on Hadoop. Experiments on different size of datasets demonstrate that our proposed algorithm shows good performance on speedup,scaleup and sizeup. Thus it fits to data clustering on huge datasets.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133

Research on Parallel k-means Algorithm Design Based on Hadoop Platform基于云计算平台Hadoop的并行k-means聚类算法设计研究

Research on Parallel k-means Algorithm Design Based on Hadoop Platform
基于云计算平台Hadoop的并行k-means聚类算法设计研究