全部 标题 作者 关键词 摘要
Keywords: 不良网页,文本分类,k最近邻分类算法,hadoop,mapreduce
Full-Text Cite this paper Add to My Lib
?互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的k最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的hadoop软件所提供的mapreduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133