|
- 2018
特征选择方法中三种度量的比较研究DOI: 10. 15938 /j. jhust. 2018. 01. 020 Keywords: 特征选择,线性相关系数,对称不确定性,互信息,基于相关性的快速特征选择方法 Abstract: 不同类型数据中特征与类别以及特征与特征之间存在一定的线性和非线性相关性。 针对基于不同度量的特征选择方法在不同类型数据集上选取的特征存在明显差别的问题,本文选 择线性相关系数、对称不确定性和互信息三种常用的线性或非线性度量,将它们应用于基于相关性 的快速特征选择方法中,对它们在基因微阵列和图像数据上的特征选择效果进行实验验证和比较。 实验结果表明,基于相关性的快速特征选择方法使用线性相关系数在基因数据集上选取的特征集 往往具有较好分类准确率,使用互信息在图像数据集上选取的特征集的分类效果较好,使用对称不 确定性在两种类型数据上选取特征的分类效果较为稳定
|