%0 Journal Article %T 一种不需分词的中文文本分类方法 %A 许云 %A 樊孝忠 %A 张锋 %J 北京理工大学学报 %D 2005 %X 提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%. %K 文本分类 %K 分词 %K n元语法模型 %U http://journal.bit.edu.cn/zr/ch/reader/view_abstract.aspx?file_no=20050907&flag=1