%0 Journal Article %T 基于远距离监督和模式匹配的职衔履历属性抽取 %A 刘春花 %A 田悦 %J 计算机应用 %D 2016 %R 10.11772/j.issn.1001-9081.2016.02.0455 %X 摘要 针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的F值达到55.37%,显著高于评测最好成绩(F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法(F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性 %K 人物属性抽取 %K 职衔履历信息 %K 远距离监督 %K 模式匹配 %K 规则过滤 %U http://www.joca.cn/CN/abstract/abstract19003.shtml