|
大连理工大学学报 2012
CRF与规则相结合的中文地名识别DOI: 10.7511/dllgxb201202021, PP. 285-289 Keywords: 中文信息处理,中文地名识别,条件随机域,基于规则的后处理 Abstract: 采用递增式学习策略优化条件随机域(conditionalrandomfields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%.
|