%0 Journal Article %T 一种基于类别分布信息的中文文本分类模型 %A 刘海峰 %A 王元元 %A 姚泽清 %J 图书情报工作 %D 2008 %X ?特征降维是文本分类面临的主要问题之一。首先通过分布对特征项进行选择,然后使用一种改进的基于密度聚类方法对选择后的特征项进行聚类,借助类别分布信息,在尽量减少信息缺失的前提下先后两次对文本特征维数进行了压缩;在基于类别概率分布的模式下实现文本的矩阵表示,借助矩阵理论进行文本分类。试验结果表明,该方法的分类效率较高。 %U http://124.16.154.130:8080/lis/CN/abstract/abstract8647.shtml