%0 Journal Article
%T 一种基于字的多模型中文分词方法
%A 张少阳
%A 王裴岩
%A 蔡东风
%J 沈阳航空航天大学学报
%D 2017
%X 摘要 字标注的分词方法是当前中文分词领域中一种较为有效的分词方法。但由于中文汉字本身带有语义信息，不同的字在不同语境中其含义与作用不同，导致与上下文的相关性不同，造成每个字的构词规律存在差异。针对这一问题，本文提出了一种多模型的分词方法。该方法对每个字单独建立模型，能够有效区分每个特征对不同待切分字的影响，从而学习出每个字的特殊构词规律。由于Embedding的特征表示能够有效地解决特征稀疏问题，本文采用特征Embedding来表示输入特征。实验结果表明，该方法是一种有效的中文分词方法，很好的区分出了同类特征对于不同字的作用程度，充分体现了每个字的构词规律
%U http://xuebao.sau.edu.cn/CN/abstract/abstract470.shtml