|
中山大学学报(自然科学版) 2015
利用中文在线资源的远程监督人物关系抽取Keywords: 人物关系抽取,远程监督,人物关系知识库,标签传播算法 Abstract: 摘要 人物关系抽取是信息抽取研究中的一个重要领域,针对需要预先定义人物关系类型的不足,提出一种利用中文在线资源的远程监督人物关系抽取方法.该方法首先利用Web上已经通过半人工化方式形成的在线百科网站自动构建知识库,以获取尽可能全面且准确的关系类型及其人物关系实例.接着提取语料库中所有共现的人名对以及上下文特征,并将人名对与知识库中关系实例相互匹配,得到标记关系的人名对集合和未标记的人名对集合.最后,引入标签传播算法实现未标记人名对的关系匹配.在SogouC、sohu和baidu语料库上进行实验,结果表明该方法能够充分利用在线百科中丰富的关系类型,并且都可获得近70%的准确率.
|