%0 Journal Article %T 基于分层聚类及重采样的大规模数据分类 %A 张永 %A 浮盼盼 %A 张玉婷 %J 计算机应用 %D 2013 %X ?针对大规模数据的分类问题,将监督学习与无监督学习结合起来,提出了一种基于分层聚类和重采样技术的支持向量机(svm)分类方法。该方法首先利用无监督学习算法中的k-means聚类分析技术将数据集划分成不同的子集,然后对各个子集进行逐类聚类,分别选出各类中心邻域内的样本点,构成最终的训练集,最后利用支持向量机对所选择的最具代表样本点进行训练建模。实验表明,所提方法可以大幅度降低支持向量机的学习代价,其分类精度比随机欠采样更优,而且可以达到采用完整数据集训练所得的结果 %K 海量数据 %K 分类 %K 聚类 %K 重采样 %K 支持向量机 %U http://www.joca.cn/CN/abstract/abstract16739.shtml