%0 Journal Article %T 基于类别加权和方差统计的特征选择方法 %J 北京工业大学学报 %D 2014 %X 为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选择的影响,给出了一种类别加权策略以强化小类别的特征;其次,在探究特征类别区分能力的基础上,设计了类别方差统计策略来凸显含有丰富类别信息的特征;最后,将2种策略相融合,实现了一种联合特征选择的新算法.在Reuters-21578和复旦大学语料这2个不均衡语料上的实验都表明:该算法有效,特别是在小类别的分类效果上远远好于IG、CHI和DFICF等流行的通用算法. %K 文本分类 %K 不均衡数据集 %K 特征选择方法 %K 类别加权 %K 方差统计 %U http://www.bjgd.cbpt.cnki.net/WKA/WebPublication/paperDigest.aspx?paperID=b374f50a-c2f2-498f-a01e-8d49fd43d6de