%0 Journal Article %T 基于改进k最近邻分类算法的不良网页并行识别 %A 徐雅斌 %A 李卓 %A 陈俊伊 %J 计算机应用 %D 2013 %X ?互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的k最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的hadoop软件所提供的mapreduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 %K 不良网页 %K 文本分类 %K k最近邻分类算法 %K hadoop %K mapreduce %U http://www.joca.cn/CN/abstract/abstract16876.shtml