全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于mapreduce的文本层次聚类并行化

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对传统的层次聚类算法在处理大规模文本时可扩展性不足的问题,提出基于mapreduce编程模型的并行化文本层次聚类算法。将基于文本向量分量组特征统计的垂直数据划分算法应用于mapreduce的数据分发,将mapreduce的排序特性应用于合并点的选择,使得算法更加高效,同时有利于提高聚类精度。实验结果表明了利用该算法进行大规模文本聚类的有效性及良好的可扩展性。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133