|
软件学报 2009
一种解决大规模数据集问题的核主成分分析算法, PP. 2153-2159 Keywords: 核主成分分析,gram矩阵,大规模数据集,协方差无关,特征分解 Abstract: 提出一种大规模数据集求解核主成分的计算方法.首先使用gram矩阵生成一个gram-power矩阵,根据线性代数的理论可知,新形成的矩阵和原先的gram矩阵具有相同的特征向量.因此,可以把gram矩阵的每一列看成核空间迭代算法的输入样本,这样,无须使用特征分解即可迭代地计算出核主成分.该算法的空间复杂度只有o(m);在大规模数据集的情况下,时间复杂度也降低为o(pkm).实验结果表明了所提出算法的有效性.更为重要的是,在大规模数据集的情况下,当传统的特征分解技术无法使用时,该方法仍然可以提取非线性特征.
|