|
计算机系统应用 2007
基于Open Source的全文检索框架Keywords: 全文检索,Lucene,设计模式,程序框架,Source,Open,全文检索,支持,开发,信息系统,工具包,完全,文档格式,Word,HTML,框架,可扩展,设计,分析,结合,Jakarta,Lucene,项目 Abstract: 本文在开源(Open Source)项目Jakarta Lucene的基础上,结合多种开源文档格式分析工具,设计和实现了一种可扩展的全文检索框架,该框架可高效地对XML、HTML、MS Word、PDF等格式的文档进行全文检索.整个框架完全基于开源工具包,可以有效地对信息系统的开发进行支持.
|