|
中山大学学报(自然科学版) 2018
融入密度和距离的K-means初始簇中心优选方法研究Keywords: K-means算法,密度,贪心策略,最大距离,初始簇中心 Abstract: 摘要 K-means算法随机选取初始簇中心易导致聚类不稳定、准确率低等问题.为了解决上述问题,提出融入密度和距离的K-means初始簇中心优选方法.该方法首先选取距离最远的两个样本点进行贪心策略的密度聚类,形成两个临时初始簇,接着不断选取距临时初始簇质心距离乘积最大值点进行密度聚类,直到形成K个临时初始簇,最后在每个簇中选取核心点作为初始簇中心.在Letter数据集进行实验,证明所选取初始簇中心进行K-means聚类具有更好的稳定性、更高的准确率
|