全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于相似页面的web信息抽取系统的实现

Keywords: web页面,roadrunner,相似页面,信息抽取

Full-Text   Cite this paper   Add to My Lib

Abstract:

?分析了roadrunner的核心算法,针对roadrunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的web信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133