|
华侨大学学报(自然科学版) 2017
采用相关反馈和文档相似度的维吾尔语检索词加权方法DOI: 10.11830/ISSN.1000-5013.201703022 Keywords: 维吾尔语, 文档检索, 检索词加权, 相关反馈, 文档相似度 Abstract: 针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.
|