%0 Journal Article
%T Design and implementation of adaptive best-first Web spider
自适应最优搜索算法的网络蜘蛛的设计与实现
%A WEI Wen-guo
%A XIE Gui-yuan
%A
魏文国
%A 谢桂园
%J 计算机应用
%D 2007
%I
%X 主题搜索引擎NonHogSearch改进了采用最优搜索算法的网络蜘蛛的搜索过程,控制了搜索的贪婪程度;并引入网页信噪比概念,从而判断网页是否属于所要搜索的主题页面;进一步,NonHogSearch在爬行过程中自动更新链接的权重,当得到主题相关页面时产生回报,将回报沿链接链路逆向反馈,更新链路上所有链接的Q值,这样避免了网络蜘蛛过早陷入Web搜索空间中局部最优子空间的陷阱,并通过并行方式实现多条链路的同时搜索,改进了搜索引擎的性能。实验证实了该算法在查全率与查准率两方面都有一定的优越性。
%K topic-specific Web spider
%K best-first search algorithm
%K online-incremental adaptive learning
%K signal-to-noise ratio of web page
个性化网络蜘蛛
%K 最优搜索算法
%K 在线增量自学习
%K 网页信噪比
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=831E194C147C78FAAFCC50BC7ADD1732&aid=ABEED683F48C1C41D66D738363ED7C3F&yid=A732AF04DDA03BB3&vid=DB817633AA4F79B9&iid=708DD6B15D2464E8&sid=2A6133047507E561&eid=2EE8C81DB5D48A50&journal_id=1001-9081&journal_name=计算机应用&referenced_num=0&reference_num=6