|
中山大学学报(自然科学版) 2018
中文微博情感分析模型SR-CBOWKeywords: 情感分析,SR-CBOW模型,数据平衡,否定扩散 Abstract: 摘要 中文微博情感分析旨在挖掘文本中用户所要表达的观点及情感倾向,被应用于政治、商业等诸多领域.考虑到微博数据的口语化和不规范性等特点以及中文标注数据相对匮乏的现状,对词向量训练模型CBOW进行拓展,提出情感分析模型SR-CBOW.首先利用基于语义相似度的数据平衡方法来均衡数据集;然后采用否定扩散的手段,协助模型对包含否定词的微博进行情感转移;最后模型利用大量无标注的微博语料进行无监督的词向量训练;同时对构建的微博的向量表示进行情感分类.在细粒度的情绪识别和粗粒度的情感倾向性分析中,都取得了较好的结果,较于NLP&CC2013情绪识别评测任务中最好的结果,其微平均F值提高了14.9%
|