基于相关性和冗余度的联合特征选择方法
Keywords: 文本情感分类,联合特征选择,相关性,冗余特征
Abstract:
比较研究了与类别信息无关的文档频率和与类别信息有关的信息增益、互信息和zx统计特征选择方法,在此基础上分析了以往直接组合这两类特征选择方法的弊端,并提出基于相关性和冗余度的联合特征选择算法。该算法将文档频率方法分别与信息增益、互信息和zr统计方法联合进行特征选择,旨在删除冗余特征,并保留有利于分类的特征,从而提高文本情感分类效果。实验结果表明,该联合特征选择方法具有较好的性能,并且能够有效降低特征维数。
Full-Text