全部 标题 作者 关键词 摘要
Keywords: heritrix,信息抽取,htmlparser,web数据采集
Full-Text Cite this paper Add to My Lib
?针对现阶段web信息抽取技术的不足,提出一种基于heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133