|
计算机科学 2013
不平衡数据分类方法及其在入侵检测中的应用研究Keywords: 不平衡数据,k-s统计,逻辑回归,入侵检测 Abstract: 直接将传统的分类方法应用于不平衡数据集时,往往导致少数类的分类精度低下。提出一种基于k-s统计的不平衡数据分类方法,以有效提高少数类的识别率。利用k-s统计评估分类与特征之间的关系,去除冗余特征,并且构建k-s决策树获得数据分片,调整数据的不平衡度;最后对分片数据双向抽样调整,进行分类学习。该方法使用的k-s统计假设条件极易满足,其效率高且适用性强。通过kdd99入侵检测数据的分析对比表明,对于不平衡的数据集,该方法对多数类及少数类都具有较高的分类精度。
|