|
电子与信息学报 2008
A SMT-based Approach for Query Expansion in Information Retrieval
|
Abstract:
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响.该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法.通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展.在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12 %~17% 的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率.