全部 标题 作者 关键词 摘要
Keywords: 短文本分类,关联规则挖掘,特征扩展
Full-Text Cite this paper Add to My Lib
?针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用fpgrowth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语义信息并且改进了知网中def词条的描述能力公式,在此基础上对中文短文本进行分类。实验证明,这种方法具有高的分类性能,其微平均和宏平均值都高于常规的文本分类方法。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133