|
现代图书情报技术 2010
基于nutch的开放存取搜索引擎构建研究Keywords: 开放存取,搜索引擎,nutch,中文学术资源,基于粒度概念分析法的文献关键词分析——以ontology领域关键词为例,基于关键词的搜索引擎优化策略及效果分析* Abstract: ?研究当前主要的开放存取搜索系统的实现机制,选择基于网络爬虫的搜索引擎技术,利用开源软件nutch构建分布式dsearch实验系统,为开放存取资源出版和信息服务机构提供一种高效、灵活、可定制的检索工具。重点介绍dsearch系统核心技术——分布式集群配置、中文分词模块修改和索引设置,并通过设定的种子列表实验对dsearch系统实现的功能和效果进行评价。
|