全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于bagging-svm集成分类器的网页作弊检测

DOI: 10.11896/j.issn.1002-137X.2015.01.053

Keywords: 网页作弊,集成分类器,特征选择,信息熵,弱分类器

Full-Text   Cite this paper   Add to My Lib

Abstract:

网页作弊不仅造成信息检索质量下降,而且给互联网的安全也带来了极大的挑战。提出了一种基于bagging-svm集成分类器的网页作弊检测方法。在预处理阶段,首先采用k-means方法解决数据集的不平衡问题,然后采用cfs特征选择方法筛选出最优特征子集,最后对特征子集进行信息熵离散化处理。在分类器训练阶段,通过bagging方法构建多个训练集并分别对每个训练集进行svm学习来产生弱分类器。在检测阶段,通过多个弱分类器投票决定测试样本所属类别。在数据集webspam-uk2006上的实验结果表明,在使用特征数量较少的情况下,本检测方法可以获得非常好的检测效果。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133