%0 Journal Article %T 一种评价搜索引擎信息覆盖率的模型及其验证 %A 孟涛 %A 闫宏飞 %A 李晓明 %J 电子学报 %P 1168-1172 %D 2003 %X 搜索引擎的网页搜集子系统通常以WWW的网页构成的有向图结构为依据,循着网页间的链接进行搜集从而扩大信息覆盖面.本文针对这种信息覆盖能力,建立量化模型从多个角度考察搜集系统对WWW信息资源的覆盖程度.文章首先分析了网页搜集不完全性的若干因素,在指出信息覆盖率的研究意义后提出了三类重要的信息覆盖率概念,然后围绕其中的数量和质量覆盖率展开研究工作.在建立"采样-权值计算-验证"的覆盖率评测模型之后,以北大"燕穹"网页信息博物馆为考察对象并获得其网页数据,用不同的方式对中国Web进行采样;然后分别采用PageRank和HITS两种网页权值算法算出其中的重要网页作为样本,从量和质的角度考察"燕穹"系统的信息覆盖率,得到合理的数量和质量覆盖率值,从而验证了"燕穹"系统信息覆盖率结论的合理性和该信息覆盖率评测模型的可靠性. %K 搜索引擎 %K 信息覆盖率 %K 采样 %K 权值计算 %K 验证 %K 数量覆盖率 %K 质量覆盖率 %U http://www.ejournal.org.cn/CN/abstract/abstract5518.shtml