|
中山大学学报(自然科学版) 2019
多语言文本情绪分析模型MF-CSELKeywords: 情绪分析,多语言文本,代价敏感,多特征融合 Abstract: 摘要 现有的情绪分析方法大多针对单语言文本,但类似中英文混合的多语言表达方式被广泛应用于微博、Twitter等网络社交平台中,多语言文本情绪分析成为情感分析研究领域的重要问题之一.本文针对中英混合文本提出情绪分析模型MF-CSEL,首先基于CBOW模型训练词向量,提出新的词向量组合方式学习含有语序信息的文本向量,并针对不同语言分别提取文本情感特征,融合TF-IDF权值矩阵,最后通过代价敏感集成学习方法对多语言文本进行细粒度的情感分析.本文提出基于语义相似度的样本空间重构算法以平衡数据集,降低错分代价,使用代价敏感集成策略去融合基分类器SVM和NB的分类结果以得到最终实验结果.同NLPCC2018多语言文本情绪分析任务的评测结果对比,结果表明本文方法具有有效性
|