|
- 2018
基于SVM 的高维混合特征短文本情感分类DOI: 10.3969/j.issn.1673-629X.2018.02.020 Keywords: 情感分类, 混合特征, 支持向量机, 情感词典 Abstract: 针对短文本具有的稀疏性、不规范性、主题不明确性等相关特点,提出一种基于 SVM 的高维混合特征模型。首先介绍了兼顾语义和情感的 6 类特征:表情符号特征、词聚类特征、词性标注特征、n-gram 特征、否定特征和情感词典。其中主要介绍了该 6 类特征的概念、抽取方式以及输出形式;其次在第六届中文倾向性分析评测(COAE2014)为基础的数据集上,采用 5 折交叉的方法对该模型进行了有效性验证,其平均准确率为 84.69%、平均召回率为 83.13%,而平均 F 1 值为 83.90%;接着探讨了 SVM 惩罚系数对实验的影响;最后将该模型与一步三分类方法、Recursive Auto Encoder、Doc2vec 做了对比分析,结果表明提出的模型对短文本情感分类更有效
|