|
中山大学学报(自然科学版) 2018
分组加权t-SNE的手写数字奇异类样本聚类方法研究Keywords: 奇异手写体数字识别,t分布随机领域嵌入算法,分组加权,高维降维 Abstract: 摘要 针对t-SNE算法在高维降维中存在的奇异类样本区分能力弱的不足,给出了一种将分组加权的改进t-SNE算法应用于数字手写体奇异类样本的聚类和识别中的方法.该方法根据样本在高维空间内的不同分布状况而应用不同的分组权值重新计算相似度,进而实现更合理的高维空间到低维空间的聚类映射.在基于MNIST构建的奇异类样本库上的对比试验结果表明,与t-SNE算法相比,分组加权t-SNE算法的聚类可视化与指标均得到了提高,其中查全率平均提高了4%,查准率平均提高了3.3%,从而验证了该方法的可行性和有效性
|