|
中山大学学报(自然科学版) 2018
海量法律文书中基于CNN的实体关系抽取技术Abstract: 摘要 传统文本实体关系抽取算法多数是基于特征向量对单一实体对语句进行处理,缺少考虑文本语法结构及针对多对实体关系的抽取算法.基于此,提出一种基于CNN(Convolutional Neural Network)和改进核函数的多实体关系抽取技术—KMCNN(MultiEntity Convolutional Neural Network Based on Kernel),并将所提技术运用于海量法律文书的实体关系抽取上.KMCNN从抽取大规模历史法律文书的人物关系出发,构建短语有效子树,采用基于改进的核函数来计算短语有效子树的相似度,以实现运用CNN算法对多对实体关系进行挖掘的目标.在真实数据集上的实验表明,所提技术具有较好的抽取效果和较高的计算效率
|