复杂中文文本的实体关系抽取研究
Keywords: 实体关系抽取,语法特征,启发式规则,语义序列核
Abstract:
实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和knn机器学习算法结合的方法来分类和标注关系的类型。通过对ace:评测定义下的两个子类的实体关系抽取,关系抽取的平均f值达到了76%,明显高于传统的基于特征向量和最短依存路径核的方法。
Full-Text