一种改进的基于后缀树模型搜索结果聚类算法
Keywords: 搜索结果聚类,后缀树模型,向量空间模型,奇异值分解
Abstract:
针对现有搜索结果分类算法在聚类标签筛选、聚类质量评估及控制重叠聚类方面的缺陷,提出了一种改进的基于向量空间模型与后缀树模型的检索结果聚类算法,从而完善了lingo算法的聚类及聚类标签打分函数,增加了基本类合并过程,改善了对中文的处理效果。最后对算法的分类效果及产生标签的质量进了实验分析,基于carrot2框架,建立了wcb搜索结果聚类推荐平台。验证了cqig算法分类的准确性和聚类标签的区分性和可读性。
Full-Text