全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于mapreduce的web标签soinn聚类算法

DOI: 10.11896/j.issn.1002-137X.2014.12.043

Keywords: web标签聚类,soinn算法,mapreduce

Full-Text   Cite this paper   Add to My Lib

Abstract:

web标签有助于用户根据自己特定的兴趣完成信息资源的分类、组织和检索。然而,正是由于协同标记系统特有的公开性、自由化的特点,采用其对信息资源进行描述、组织、分类和检索,存在着信息描述不精确、标签组织混乱和标签语意模糊等问题。在此背景下提出了3种基于特征向量表示法(fvr)的web标签soinn聚类算法:基于资源的特征向量表示法、基于其他共现标签的特征向量表示法和基于全集共现标签的特征向量表示法。同时应用mapreduce框架将soinn算法进行并行化。实验表明,当类中心数量超过2000时,3种分布式聚类fvr算法的召回率和准确度优于原始算法,可获得很好的加速比。从而证明此分布式聚类算法具有很好的可扩展性,可以用于更为海量的web日志聚类分析系统。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133