%0 Journal Article %T 基于Aho-Corasick自动机算法的概率模型中文分词CPACA算法<br>A Probability Model Chinese Word Segmentation Algorithm Based on Aho-Corasick Automata Algorithm %A 徐懿彬 %J 电子科技大学学报 %D 2017 %R 10.3969/j.issn.1001-0548.2017.02.018 %X Aho-Corasick自动机算法是著名的多模式串匹配算法, 它在模式串失配时,通过fail指针转移至有效的后续状态,存在一个或多个有效的后续状态可能。据此特性,该文提出了一种适应于中文分词的自动机算法。该算法使用动态规划的方法,计算上下文匹配概率,转移至最佳的有效后续状态,即实现了基于字符串匹配的机械分词方法与基于统计概率模型的方法结合。实验结果表明,该算法分词准确率高。<br> %K AC自动机 %K 中文分词 %K 动态规划 %K Trie树< %K br> %U http://manu50.magtech.com.cn/dzkjdx/CN/abstract/abstract347.shtml