%0 Journal Article %T 基于K-最近距离的自动文本分类的研究 %A 孙健 %A 王伟 %A 钟义信 %J 北京邮电大学学报 %P 42-46 %D 2001 %X 提出并实现了利用统计词频信息和语言信息相结合的方法选择特征,计算特征的权重值时不仅考虑词频,还利用了特征的集中度、分散度.经过训练和统计对每一类文本形成特征的权重向量,利用K-最近距离的方法对测试集进行分类.对英文文本的测试结果表明,该算法提高了文本分类的准确率. %K 自然语言理解 %K 向量空间模型 %K K-最近距离 %K 自动文本分类 %U http://www.buptjournal.cn/CN/abstract/abstract2499.shtml