%0 Journal Article %T 使用概念描述的中文短文本分类算法 %A 杨天平 %A 朱征宇 %J 计算机应用 %D 2012 %X ?针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种使用了概念描述的短文本分类算法,该方法首先构建出全局的语义概念词表;然后,使用概念词表分别对预测短文本和训练短文本概念化描述,使得预测短文本在训练集中找出拥有相似概念描述的训练短文本组合成预测长文本,同时将训练集内部的短文本也进行自组合形成训练长文本;最后,再使用传统的长文本分类算法进行分类。实验证明,该方法能够有效挖掘短文本内部隐含的语义信息,充分对短文本进行语义扩展,提高了短文本分类的准确度。 %K 短文本分类 %K 概念描述 %K 数据挖掘 %K 机器学习 %K 自然语言处理 %U http://www.joca.cn/CN/abstract/abstract16059.shtml