%0 Journal Article %T 基于条件随机场的顿号边界识别 %A 莫怡文 %A 姬东鸿 %A 黄江平 %J 计算机应用 %D 2015 %X ?标点符号的边界识别是自然语言处理的重要研究内容,它是分词、语块识别等应用的基础。为了实现中文中用于表示并列成分分割的顿号的边界识别,采用了用于序列分割和标记的条件随机场(crf)方法进行顿号边界识别。首先对顿号边界识别任务进行了两种类型的描述,然后对顿号语料的标注方法和过程以及特征选择进行了研究,通过采用语料推荐和十折交叉验证两种数据集分配方法分别进行了边界识别实验。实验结果表明,通过条件随机场方法结合选择的边界识别特征能够进行顿号边界识别,其顿号边界识别的f值在基准实验的基础上提高了10.57%,由顿号分隔的词语识别其f值可达85.24%。 %K 条件随机场 %K 顿号 %K 边界识别 %K 特征选择 %U http://www.joca.cn/CN/abstract/abstract18582.shtml