全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于网页链接分类的pagerank并行算法

Keywords: 链接分类,hadoop,pagerank,mapreduce,数据压缩

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对串行pagerank算法在处理海量网页数据时效率低下的问题,提出一种基于网页链接分类的pagerank并行算法.首先,将网页按照网页所属网站分类,为来自不同站点的网页设置不同的权重;其次,利用hadoop并行计算框架,结合mapreduce分而治之的特点,并行计算网页排名;最后,采用一种包含3层:数据层、预处理层、计算层的数据压缩方法,对并行算法进行优化.实验结果表明,与串行pagerank算法相比,所提算法在最好情况下结果准确率提高了12%,计算效率提高了33%.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133