全部 标题 作者 关键词 摘要
Keywords: rss,博客,信息采集
Full-Text Cite this paper Add to My Lib
?提出一种基于rss的博客采集系统实现方案。设计两个爬虫,一个负责广度优先遍历互联网,获取每个用户对应的rss地址;另一个负责对每个rss地址垂直搜索,跟踪检测是否有更新的博客文章,以增量方式将更新文章装入数据库。并为算法设计实现一个模型系统。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133