全部 标题 作者 关键词 摘要
Keywords: 网络爬虫,深度网络,id3算法
Full-Text Cite this paper Add to My Lib
?针对目前web信息挖掘中存在的信息覆盖率较低的问题,对网络爬虫系统进行研究,提出一种针对深度网络的、基于id3分类算法的web页面收集方法。对web页面的特征进行分析、处理和分类,提取包含深度网页的表单,通过自动提交这些表单来进行更深和更广的页面获取,实验表明该方法可以有效减少现有搜索引擎的盲区,改善搜索结果。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133