%0 Journal Article %T 一种网络广告点击欺诈检测的SVM集成方法 %A 刘学军 %A 张欣 %A 李斌 %A 郭汉 %J 中山大学学报(自然科学版) %D 2018 %X 摘要 针对以套取广告费为目的、实施恶意点击欺诈的不法发布商检测问题,提出一种基于支持向量机(Support Vector Machine,SVM)集成方法的点击欺诈检测系统.该系统首先对几百万条原始点击数据进行一系列数据清洗、整理和统计特征计算等数据预处理,之后利用随机欠抽样(RUS)与合成少数类过抽样技术(SMOTE)相结合的方法处理非平衡数据集得到多个平衡数据集,在每个平衡数据集上分别利用Boosting算法对训练得到基支持向量机迭代生成多个强分类器模型,最后再将多个强分类器以投票方式进行集成得到最终的检测模型.在真实点击数据上完成对广告发布商的点击欺诈检测,实验结果表明,该方法对点击欺诈有良好的检测性能,其检测准确度在90%以上 %K 点击欺诈 %K 集成方法 %K 数据预处理 %K 非平衡 %K Boosting %U http://xwxt.sict.ac.cn/CN/abstract/abstract4429.shtml