%0 Journal Article %T 基于主题的web文本聚类方法 %A 张万山 %A 肖瑶 %A 梁俊杰 %A 余敦辉 %J 计算机应用 %D 2014 %X ?针对传统web文本聚类算法没有考虑web文本主题信息导致对多主题web文本聚类结果准确率不高的问题,提出基于主题的web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题web文本的聚类。相对于传统的web文本聚类算法,所提方法充分考虑了web文本的主题信息。实验结果表明,对多主题web文本聚类,所提方法的准确率比基于k-means的文本聚类方法和基于《知网》的文本聚类方法要好。 %U http://www.joca.cn/CN/abstract/abstract17612.shtml