%0 Journal Article %T 基于CUDA的KNN算法并行化研究 %A 刘志 %A 刘端阳 %A 郑江帆 %J 中山大学学报(自然科学版) %D 2019 %X 摘要 KNN分类算法在面对大规模数据集时,计算时间将随着数据集的增大而成倍增长,为了提升算法的运算性能,设计了一种基于CUDA模型的并行KNN算法,即GS_KNN算法.针对KNN算法进行了并行化分析,在距离计算阶段采用通用矩阵乘加速,提高了计算速度;在距离排序阶段根据k值的大小提出两种策略,分别是基于k次最小值查找的最近邻选择和基于双调排序的最近邻选择;在决定分类标号阶段采用CUDA内部的原子加法操作,从而提高整体性能.使用KDDCUP99数据集对改进算法进行实验,结果表明,在保证实验结果准确性的情况下,改进算法提高了计算速度,与经典的BF-CUDA算法相比加速比达到2.8倍 %K KNN %K CUDA %K 并行计算 %K 大数据 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4981.shtml