%0 Journal Article %T 基于词向量的文本特征选择方法研究 %A 李俊 %A 陈磊 %J 中山大学学报(自然科学版) %D 2018 %X 摘要 文本分类的效果依赖于文本特征选择的好坏.传统的特征选择方法,利用特征的词频或者特征与类别的关系,进行特征选择.不仅没有考虑特征的语义,而且大多只能用于标注数据集的特征选择.本文提出LDA词向量特征选择方法和Word2vec词向量特征选择方法,分别在主题空间和词语上下文关系上,学习特征的语义,进行特征选择.语料经特征选择后,利用向量空间模型进行分类.在复旦语料上的实验结果表明,基于词向量的特征选择分类效果相对于传统的特征选择得到了改善.并且,基于词向量的特征选择是一种无监督的方法,无需标注类别信息 %K 特征选择 %K LDA %K Word2vec %K 词向量 %K 文本分类 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4435.shtml