%0 Journal Article %T 基于递归神经网络的文本分类研究 %A 杜昌顺 %A 黄磊 %J 北京化工大学学报(自然科学版) %D 2017 %R 10.13543/j.bhxbzr.2017.01.017 %X 使用基于长短项记忆(LSTM)和门阀递归单元(GRU)计算节点的双向递归神经网络提取文本特征,然后使用softmax对文本特征进行分类。这种基于深度学习的神经网络模型以词向量作为基本输入单元,充分考虑了单词的语义和语法信息,并且在神经网络的计算过程中严格遵守单词之间的顺序,保留原文本中语义组合的方式,可以克服传统文本分类方法的不足。使用本文所提方法在第三届自然语言处理和中文计算会议(NLPCC 2014)公布的新华社新闻分类语料和路透社RCV1-v2语料上进行实验,其分类F1值分别达到了88.3%和50.5%,相较于传统的基线模型有显著的提升。由于该方法不需要人工设计特征,因此具有很好的可移植性。 %K 文本分类 %K 深度学习 %K 长短项记忆(LSTM) %K 门阀递归单元(GRU) %K 双向递归神经网络 %K 词向量 %U http://www.journal.buct.edu.cn/CN/abstract/abstract15560.shtml