全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
-  2013 

一种分布式网络爬虫的设计与实现
Design and Implementation of a Distributed Web Crawler

Keywords: 分布式系统,网络爬虫,设计
分布式系统 网络爬虫 设计
,分布式系统 网络爬虫 设计,分布式系统 网络爬虫 设计

Full-Text   Cite this paper   Add to My Lib

Abstract:

利用用户指定的关键字和搜索引擎生成URL种子,通过分布式网络爬虫抽取符合用户需求的网页作为研究所用的语料.实验结果表明:分布式网络爬虫可以较好地解决在短时间内抽取大量语料的需求.
User-specified keywords to generate URL seeds by search engine has been used.Webpage for user's requirements as research corpus through distributed web crawler has been extracted.Experiments show that the distributed web crawler can be good solution to extract a large number of corpora in a short time

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133