%0 Journal Article %T 不平衡训练数据下的基于深度学习的文本分类 %A 郭武 %A 陈志 %J 中山大学学报(自然科学版) %D 2020 %X 摘要 近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类别的训练数据不均衡时,训练得到的神经网络模型会由多数类所主导,分类结果往往倾向多数类,极大影响了分类效果.针对这种情况,本文在卷积神经网络训练过程中,损失函数引入类别标签权重,强化少数类对模型参数的影响.在复旦大学文本分类数据集上进行测试,实验表明本文提出的方法相比于基线系统宏平均F1值提高了449%,较好地解决数据不平衡分类问题 %K 不平衡数据集 %K 词向量 %K 卷积神经网络 %K 文本分类 %U http://xwxt.sict.ac.cn/CN/abstract/abstract5235.shtml