|
天津大学学报(自然科学与工程技术版) 2006
wide:海量数据的聚类算法, PP. 826-831 Keywords: 窗口,混合型数据,含障碍物数据聚类,增量聚类,分布式并行聚类 Abstract: 给出了一种新的处理海量数据的聚类算法wide(window-densityclusteringalgorithm).它通过网格方法将数据之间的相互关联局部化,通过窗口技术来提高算法的效率,通过密度方法提高聚类的精度.以窗口为中介将网格方法和密度方法融合在一起是算法的主要思想.在此基础上对算法进行了扩展,在功能方面实现了混合型数据聚类、含障碍物数据聚类和增量数据聚类;在速度方面实现了分布式并行聚类.wide算法能够在局域网中的多台计算机上并行工作,效率高,计算复杂度为o(n),且能够发现任意形状的聚类,对噪声不敏感.
|