|
计算机科学 2015
一种改进k-means算法的聚类算法cardbkDOI: 10.11896/j.issn.1002-137X.2015.03.041 Keywords: 聚类,文档聚类,文本聚类,k-means,算法 Abstract: cardbk聚类算法与批k-means算法的不同之处在于,每个点不是只归属于一个簇,而是同时影响多个簇的质心值,一个点影响某一个簇的质心值的程度取决于该点与其它离该点更近的簇的质心之间的距离值。从聚类结果的熵、纯度、f1值、randindex和nmi等5个性能指标值来看,与多个不同算法在多个不同数据集上分别聚类相比,该算法具有较好的聚类结果;与多个不同算法在同一数据集上很多不同的初始化条件下分别聚类相比,该算法具有较好且稳定的聚类结果;该算法在不同大小数据集上聚类时具有线性伸缩性且速度较快。
|