全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2015 

求解大规模谱聚类的近似加权核k-means算法

DOI: 10.13328/j.cnki.jos.004888, PP. 2836-2846

Keywords: 谱聚类,迹最大化,加权核k-means,近似核矩阵,大数据

Full-Text   Cite this paper   Add to My Lib

Abstract:

谱聚类将聚类问题转化成图划分问题,是一种基于代数图论的聚类方法.在求解图划分目标函数时,一般利用rayleigh熵的性质,通过计算laplacian矩阵的特征向量将原始数据点映射到一个低维的特征空间中,再进行聚类.然而在谱聚类过程中,存储相似矩阵的空间复杂度是o(n2),对laplacian矩阵特征分解的时间复杂度一般为o(n3),这样的复杂度在处理大规模数据时是无法接受的.理论证明,normalizedcut图聚类与加权核k-means都等价于矩阵迹的最大化问题.因此,可以用加权核k-means算法来优化normalizedcut的目标函数,这就避免了对laplacian矩阵特征分解.不过,加权核k-means算法需要计算核矩阵,其空间复杂度依然是o(n2).为了应对这一挑战,提出近似加权核k-means算法,仅使用核矩阵的一部分来求解大数据的谱聚类问题.理论分析和实验对比表明,近似加权核k-means的聚类表现与加权核k-means算法是相似的,但是极大地减小了时间和空间复杂性.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133