全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于nutch的专题网页资源采集服务系统的设计与实现

Keywords: nutch,网页资源采集,中文分词插件,webservice,集成服务

Full-Text   Cite this paper   Add to My Lib

Abstract:

?在数字图书馆系统集成应用的框架下,提出基于nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、gui信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于webservice的服务接口,实现其在数字图书馆资源层的集成应用。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133