|
软件学报 2003
一种基于参考点和密度的快速聚类算法, PP. 1089-1095 Abstract: 数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的curd(clusteringusingreferencesanddensity)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.curd算法保持了基于密度的聚类算法的上述优点,而且curd算法具有近似线性的时间复杂性,因此curd算法适合对大规模数据的挖掘.理论分析和实验结果也证明了curd算法具有处理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于r*-树的dbscan算法.
|