%0 Journal Article %T 基于词语相关度的微博新情感词自动识别 %A 廖健 %A 王素格 %J 计算机应用 %D 2016 %R 10.11772/j.issn.1001-9081.2016.02.0424 %X 摘要 针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法 %K 情感词识别 %K 词语相关度 %K 词向量 %K 排序算法 %K 微博 %U http://www.joca.cn/CN/abstract/abstract18997.shtml