|
计算机科学 2015
一种大数据环境下的新聚类算法Keywords: 全局kmeans,谱聚类,粒子群优化,聚类,kddcup99 Abstract: 提出了一种新的聚类算法ngkca,该算法克服了经典聚类算法检测率和稳定性的不足,适用于解决大数据环境下的聚类问题。ngkca聚类算法包括4个阶段:首先利用谱聚类njw算法对大数据集进行列降维和数据归一化处理,其次引入对初始值不敏感的粒子群算法对数据集进行行降维从而选出临时的聚类中心集,接着通过全局kmeans算法对最佳聚类中心集进行聚类以获取聚类中心点,最后使用粒子群算法对聚类中心点进行调整进而获取最终的聚类划分。在一些著名的机器学习数据集和国际标准的网络安全数据集kddcup99上进行实验,结果表明:提出的算法比谱聚类、kmeans、粒子群、全局kmeans等常见算法具有更好的稳定性和更高的检测率,与全局kmeans算法相比具有更优的时间复杂度。
|