全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于heritrix的web信息抽取

Keywords: heritrix,信息抽取,htmlparser,web数据采集

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对现阶段web信息抽取技术的不足,提出一种基于heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133