%0 Journal Article
%T Research and Implementation of Nutch-based Website Harvest and Service System in Special Field
基于Nutch的专题网页资源采集服务系统的设计与实现
%A Chang ZhirongMa ZiweiLi Gaohu
%A
常智荣马自卫李高虎
%J 现代图书情报技术
%D 2010
%I
%X 在数字图书馆系统集成应用的框架下,提出基于Nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、GUI信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、Plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于Webservice的服务接口,实现其在数字图书馆资源层的集成应用。
%K Nutch
%K 网页资源采集
%K 中文分词插件
%K Webservice
%K 集成服务
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=B5EDD921F3D863E289B22F36E70174A7007B5F5E43D63598017D41BB67247657&cid=E46382710BF131B2&jid=24AADBCD0D5373C73F37F78D10E2F717&aid=BB18D4FD7976C96A411C8B8CB0111628&yid=140ECF96957D60B2&vid=96C778EE049EE47D&iid=38B194292C032A66&sid=2A8D03AD8076A2E3&eid=96C778EE049EE47D&journal_id=1003-3513&journal_name=现代图书情报技术&referenced_num=1&reference_num=0