|
计算机科学 2002
WWW Personalized Information Retrieval Based on Measures of Interestingness
|
Abstract:
1 引言随着Internet的飞速发展,网络信息量爆炸式的增长,信息的更新速率也成倍加快。再加上WWW本身的分布性和动态性,使得发现特定的信息变得越来越困难。传统的WWW信息发现方法,使用称之为spiders或robots的自动网站信息发现程序,在Internet上进行漫游,将它们所发现的Web文档下载到本地。在本地机上,通过离线数据库的建立,对搜集到的文档进行特征抽取、聚类、索引。用户的搜索请求,由信息发现系统转化为对数据库的查询,而得到最后的搜索结果。当今一个著名的robot的实现系统就是由科罗拉多大学开发的WWW Worm系统。但是,这种基于离线数据库的信息