%0 Journal Article %T 基于t检验和弹性网的数据分类特征选择方法 %A 杜娟 %A 肖忆南 %A 谢榕 %J 中山大学学报(自然科学版) %D 2015 %X 摘要 数据分类是数据挖掘领域中一类重要的问题,然而,当前的数据挖掘工作面临着大样本量、高维度数据的挑战.从数据特征中选择出有效的数据特征子集,能够使数据降维,是进行进一步数据分类的基础.目前比较流行的特征选择方法对高维数据不太适应,精度也不高.因此,提出一种基于t检验和弹性网的特征选择方法,其基本思想是通过t检验得到特征在不同类之间的差异程度,并利用弹性网回归模型对差异程度较大的特征进行分析,通过回归系数压缩和误分类率得到最终的特征子集.本文通过实验证实了此方法在准确性、稳定性及时间代价上都具有良好的效果 %K 数据分类 %K 特征选择 %K t检验 %K 线性回归 %K 弹性网 %U http://xwxt.sict.ac.cn/CN/abstract/abstract3094.shtml