|
计算机科学 2008
基于语义理解的智能搜索引擎研究Keywords: 自然语言处理分词语义分析向量空间模型 Abstract: 本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向web网页内容的特征库,提出返回文档排序的算法,基于lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。
|