|
计算机应用 2013
基于支持向量机分类和语义信息的中文跨文本指代消解Keywords: 跨文本指代,信息抽取,支持向量机分类器,语义信息,重名消歧,多名聚合 Abstract: ?跨文本(实体)指代消解(cdcr)的任务就是把所有分布在不同文本但指向相同实体的词组合在一起形成一个指代链。传统的跨文本指代消解主要采用聚类方法来解决信息检索中遇到的重名消歧问题。将聚类问题转换为分类问题,并采用支持向量机(svm)分类器来解决信息抽取中的重名消歧和多名聚合问题。该方法可有效融合实体名称的构词特征、读音特征以及文本内部和文本外部的多种语义特征。在中文跨文本指代语料库上的实验表明,同聚类方法相比,该方法在提高精度的同时,也提高了召回率。
|