%0 Journal Article %T 运用语义集索引法实现英文文本分类 %A 吕琳 %A 刘玉树 %A 刘妍 %J 北京邮电大学学报 %P 18-21 %D 2006 %R 10.13190/jbupt.200602.18.lül %X 克服当前文本分类法中基于词形匹配带来的局限性,基于WordNet语义词典和隐含语义索引(LSI)模型,提出了基于语义集索引的英文文本分类方法.该方法在分类初期首先利用WordNet构建语义词典库,利用单词的语义集代替单词作为文本特征向量的特征项;然后利用LSI模型进一步深入挖掘语义集概念间的深层联系,将语言知识和概念索引有效地融合到文本向量空间的表示中.针对NaiveBayes及简单向量距离文本分类法的实验结果显示,2种文本分类法的分类准确率均随着语义分析的深入逐步提高,充分表明了语义挖掘对文本分类的重要性和必要性。 %K 文本分类 %K 语义集索引 %K 隐含语义索引 %U http://www.buptjournal.cn/CN/abstract/abstract1737.shtml