%0 Journal Article %T 基于rss的博客采集系统的设计与实现* %A 刘莉 %A 肖诗斌 %A 王涛 %A 施水才 %J 现代图书情报技术 %D 2007 %X ?提出一种基于rss的博客采集系统实现方案。设计两个爬虫,一个负责广度优先遍历互联网,获取每个用户对应的rss地址;另一个负责对每个rss地址垂直搜索,跟踪检测是否有更新的博客文章,以增量方式将更新文章装入数据库。并为算法设计实现一个模型系统。 %K rss %K 博客 %K 信息采集 %U http://www.infotech.ac.cn/CN/abstract/abstract447.shtml