%0 Journal Article %T 新的cdf文本分类特征提取方法研究 %A 熊忠阳 %A 蒋健 %A 张玉芳 %J 计算机应用 %D 2009 %X ?对高维的特征集进行降维是文本分类过程中的一个重要环节。本文在研究了现有的特征降维技术的基础之上,对部分常用的特征提取方法做了简要的分析,之后结合类间集中度、类内分散度和类内平均频度,提出了一个新的特征提取方法,即cdf方法。实验采用k-最近邻分类算法(knn)来考察cdf方法的有效性。结果表明该方法简单有效,能够取得比传统特征提取方法更优的降维效果。 %K 文本分类 %K 降维 %K 评价函数 %U http://www.joca.cn/CN/abstract/abstract11950.shtml