%0 Journal Article %T 基于id3分类算法的深度网络爬虫设计 %A 王舜燕 %A 李蕾 %A 吴兵华 %J 现代图书情报技术 %D 2008 %X ?针对目前web信息挖掘中存在的信息覆盖率较低的问题,对网络爬虫系统进行研究,提出一种针对深度网络的、基于id3分类算法的web页面收集方法。对web页面的特征进行分析、处理和分类,提取包含深度网页的表单,通过自动提交这些表单来进行更深和更广的页面获取,实验表明该方法可以有效减少现有搜索引擎的盲区,改善搜索结果。 %K 网络爬虫 %K 深度网络 %K id3算法 %U http://www.infotech.ac.cn/CN/abstract/abstract526.shtml