%0 Journal Article %T 一种影响空间下的快速K-means聚类算法 %A 张继福 %A 蔡江辉 %A 赵文冲 %A 赵旭俊 %J 中山大学学报(自然科学版) %D 2016 %X 摘要 K-means是一种经典的迭代划分聚类算法,但在每次迭代过程中,需要计算和比较每个数据点与所有中心点之间的距离,因此聚类过程时间开销大.利用影响空间数据结构,给出一种快速K-means聚类算法.该算法首先,引入影响空间数据结构对给定数据集进行区域划分,获得各个区域中的代表数据点;然后,对代表数据点进行K-means聚类,得到的代表数据点所属的类别即是该区域中所有数据点所属的类别,有效地降低迭代过程中的数据量,提高了聚类效率;最后,理论分析和实验结果表明,仅对代表性数据点而非数据集中所有数据点进行迭代聚类,能够在保证聚类质量的前提下,有效地提高聚类效率. %K 聚类 %K 影响空间 %K 区域划分 %K 代表元素 %U http://xwxt.sict.ac.cn/CN/abstract/abstract3604.shtml