|
哈尔滨工程大学学报 2013
最小相关结果集排序算法DOI: 10.3969/j.issn.1006?7043.201203041, PP. 494-498 Keywords: 文档聚类,检索结果集,并集度,新颖度,相关度 Abstract: 传统的信息检索系统都是按照结果与用户查询的相关性大小进行排序,返回结果之间相互孤立缺乏整体性,冗余性很大.为了使用户获得完整的相关信息,采用一种基于子主题提取的文档集合生成算法聚类相关检索结果,引入一个新概念“并集度”,最后利用相关度、并集度和新颖度对结果集重新排序.实验结果表明在进行算法改进后,整体相关度有所上升,同时排在前面的文档集合的并集度和新颖度也较大,包含的信息更加完整,冗余性更小,可以更好地满足用户的查询需求.
|