|
计算机应用 2011
基于d-score与支持向量机的混合特征选择方法Keywords: d-score,f-score,支持向量机,特征选择,评估准则,维压缩 Abstract: ?f-score作为特征评价准则时,没有考虑不同特征的不同测量量纲对特征重要性的影响。为此,提出一种新的特征评价准则d-score,该准则不仅可以衡量样本特征在两类或多类之间的辨别能力,而且不受特征测量量纲对特征重要性的影响。以d-score为特征重要性评价准则,结合前向顺序搜索、前向顺序浮动搜索以及后向浮动搜索三种特征搜索策略,以支持向量机分类正确率评价特征子集的分类性能得到三种混合的特征选择方法。这些特征选择方法结合了filter方法和wrapper方法的各自优势实现特征选择。对uci机器学习数据库中9个标准数据集的实验测试,以及与基于改进f-score与支持向量机的混合特征选择方法的实验比较,表明d-score特征评价准则是一种有效的样本特征重要性,也即特征辨别能力衡量准则。基于该准则与支持向量机的混合特征选择方法实现了有效的特征选择,在保持数据集辨识能力不变情况下实现了维数压缩。
|