%0 Journal Article %T 一种基于字的多模型中文分词方法 %A 张少阳 %A 王裴岩 %A 蔡东风 %J 沈阳航空航天大学学报 %D 2017 %X 摘要 字标注的分词方法是当前中文分词领域中一种较为有效的分词方法。但由于中文汉字本身带有语义信息,不同的字在不同语境中其含义与作用不同,导致与上下文的相关性不同,造成每个字的构词规律存在差异。针对这一问题,本文提出了一种多模型的分词方法。该方法对每个字单独建立模型,能够有效区分每个特征对不同待切分字的影响,从而学习出每个字的特殊构词规律。由于Embedding的特征表示能够有效地解决特征稀疏问题,本文采用特征Embedding来表示输入特征。实验结果表明,该方法是一种有效的中文分词方法,很好的区分出了同类特征对于不同字的作用程度,充分体现了每个字的构词规律 %U http://xuebao.sau.edu.cn/CN/abstract/abstract470.shtml