|
计算机科学 2013
基于混合测度的并行仿射传播聚类算法Keywords: 仿射传播聚类,流形距离核,共享最近邻,并行计算中图法分类号tp181文献标识码a Abstract: 针对仿射传播聚类(ap)算法应用于流形结构复杂、密度不均匀的数据集存在的不足,通过学习数据集的低维流形结构,提出了密度自适应的“流形距离核”(ad-mdk)的概念。该距离测度既考虑了数据点的局部密度信息,又包含了数据集全局结构信息,从而提高了算法对这类数据集的处理能力。同时,针对引入流形距离所带来的计算复杂问题,提出了算法的并行化设计方法,有效提高了算法处理效率。通过在多个数据集上的实验验证了所提算法在处理大规模多尺度数据集上的性能优于传统ap算法。
|