|
中山大学学报(自然科学版) 2016
一种基于混合数据相似性度量的谱聚类算法Abstract: 摘要 随着科技的发展,人们在生活中产生了大量的数据,其中部分数据具有数值型和分类型两种属性类型.现有的大多数聚类算法只能处理单一属性类型的数据,对这种混合属性的数据往往难以处理.针对这个问题提出一种基于混合数据相似度测量的谱聚类算法,首先对两种属性数据分别进行相异度度量,然后用一种相似性度量表示出混合数据之间的相似性关系,把相似性关系映射成无向图两顶点之间边的权值,最后通过谱聚类算法实现聚类划分.从UCI标准数据集选取几个混合数据集进行实验,并与其他算法进行了比较,验证了本算法对混合数据聚类的有效性
|