全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2012 

基于svm和扩展条件随机场的web实体活动抽取

DOI: 10.3724/SP.J.1001.2012.04189, PP. 2612-2627

Keywords: 信息抽取,格语法,实体活动,支持向量机,扩展条件随机场

Full-Text   Cite this paper   Add to My Lib

Abstract:

在传统信息抽取的基础上,研究web实体活动抽取,基于格语法对实体活动进行了形式化定义,并提出一种基于svm(supportedvectormachine)和扩展条件随机场的web实体活动抽取方法,能够从web上准确地抽取实体的活动信息.首先,为了避免人工标注训练数据的繁重工作,提出一种基于启发式规则的训练数据生成算法,将语义角色标注的训练数据集转化为适合web实体活动抽取的训练数据集,分别训练支持向量机分类器和扩展条件随机场.在抽取过程中,通过分类器获得包含实体活动的语句,然后利用扩展条件随机场对传统条件随机场中不能利用的标签频率特征和关系特征建模,标注自然语句中的待抽取信息,提高标注的准确率.通过多领域的实验,其结果表明,所提出的抽取方法能够较好地适用于web实体活动抽取.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133