%0 Journal Article %T 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法 %A 翟云 %A 王树鹏 %A 马楠 %A 杨炳儒 %A 张德政 %J 电子学报 %P 1311-1319 %D 2014 %R 10.3969/j.issn.0372-2112.2014.07.011 %X 非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(SyntheticMinorityOver-SamplingTechnique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合成新样本,由此产生过拟合瓶颈.为更好地解决该问题,提出了一种基于单边选择链和样本分布密度的非平衡数据挖掘新方法(One-SidedLink&DistributionDensity-SMOTE,OSLDD-SMOTE).OSLDD-SMOTE通过单边选择链遴选出处于分类边界的少数类样本,根据这些样本的动态分布密度生成新样本.进而分析了样本合成度对节点数目和对少数类精度的影响;基于G-mean、F-measure和AUC三个指标综合比较了OSLDD-SMOTE与其他同类方法的分类性能.实验结果表明,OSLDD-SMOTE有效提高了少数类样本的分类准确率. %K 非平衡数据分类 %K 单边选择链 %K 分布密度 %K 重采样 %U http://www.ejournal.org.cn/CN/abstract/abstract8294.shtml