数值型和分类型混合数据的模糊k-prototypes聚类算法
, PP. 1107-1119
Keywords: 数值型属性,分类型属性,确定聚类,模糊聚类
Abstract:
由于数据库经常同时包含数值型和分类型的属性,因此研究能够处理混合型数据的聚类算法无疑是很重要的.讨论了混合型数据的聚类问题,提出了一种模糊k-prototypes算法.该算法融合了k-means和k-modes对数值型和分类型数据的处理方法,能够处理混合类型的数据.模糊技术体现聚类的边界特征,更适合处理含有噪声和缺失数据的数据库.实验结果显示,模糊算法比相应的确定算法得到的结果准确度高.
Full-Text