基于模糊粒度计算的k-means文本聚类算法研究
Keywords: 模糊,粒度,k-means,文本聚类,归一化距离函数
Abstract:
传统的k-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度dλ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统k-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。
Full-Text