%0 Journal Article %T 一种非独立同分布下K-means算法的初始中心优化方法 %A 吕奕锟 %A 姜合 %A 潘品臣 %J 中山大学学报(自然科学版) %D 2019 %X 摘要 传统聚类算法研究都是在假设数据集的对象、属性等方面满足独立性且服从同一分布的基础上进行的.然而现实中的数据往往是非独立同分布的,即属性之间或多或少都会存在一些交互关系.传统K-means算法随机地选择初始聚类中心,对于中心点的选取比较敏感,容易陷入局部最优且准确率低.Min_max方法针对这一缺点进行了改进,但原始的和改进后的K-means算法都忽略了属性之间存在的交互关系.因此本文利用Pearson相关系数公式来计算属性之间的交互关系,并映射于原始数据集.同时利用双领域思想对Min_max方法进行了优化.实验结果表明该方法能够得到较高的准确率、较好的聚类效果以及相对较少的迭代次数 %K 非独立同分布 %K K-means算法 %K 初始聚类中心 %K Pearson相关系数 %K 双领域思想 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4990.shtml