%0 Journal Article %T Word2vec的核心架构及其应用 %A 熊富林 %A 邓怡豪 %A 唐晓晟 %J 南京师范大学学报(工程技术版) %P 43-48 %D 2015 %X 神经网络概率语言模型是一种新兴的自然语言处理算法,该模型通过学习训练语料获得词向量和概率密度函数,词向量是多维实数向量,向量中包含了自然语言中的语义和语法关系,词向量之间余弦距离的大小代表了词语之间关系的远近,词向量的加减代数运算则是计算机在“遣词造句”.近年来,神经网络概率语言模型发展迅速,Word2vec是最新技术理论的合集.首先,重点介绍Word2vec的核心架构CBOW及Skip-gram;接着,使用英文语料训练Word2vec模型,对比两种架构的异同;最后,探讨了Word2vec模型在中文语料处理中的应用. %K 自然语言处理 %K Word2vecCBOWSkip-gram %K 中文语言处理 %U http://njsfdxgckj.paperonce.org/oa/DArticle.aspx?type=view&id=201501008