|
图书情报工作 2009
基于关键词的生物主题爬虫设计*Keywords: 主题爬虫,生物学,搜索引擎,关键词,基于特色关键词的科研机构研究主题揭示:方法与实证,利用引用信息的关键词提取,基于词共现关系强度和关键词词频的叙词选词方法探究,一种探测组织知识结构的新方法:基于fca的作者关键词耦合分析,网络环境中基于语义聚类的多关键词查询机制 Abstract: ?详细介绍一种生物主题爬虫的设计及实现方案,通过优化初始种子模块、主题相关度分析模块、排序模块等四个模块的共同运行实现对网页信息的处理。用高效的主题爬虫取代传统搜索引擎中的普通爬虫,为实现更准确的信息采集提供良好基础。
|