%0 Journal Article
%T Web Crawler Technology of AJAX Frame Based on JavaScript Slicing
基于JavaScript 切片的AJAX 框架网络爬虫技术研究
%A 曾伟辉
%A 李 淼
%J 计算机系统应用
%D 2009
%I
%X 自Jesse James Garrett 提出了AJAX 概念以来,由于AJAX 在提升用户交互体验的同时,又不需要在客户端安装插件。因此,一经提出就引起了互联网领域的广泛关注。但目前的网络爬虫技术在AJAX框架的URL 解析过程中存在着不能够识别事件触发顺序等问题,导致大量数据不能被搜索引擎有效检索。本文针对此问题,通过研究基于对象的程序切片算法,以及脚本执行引擎与切片模块的互操作,最终解决AJAX 框架中URL 提取以及异步JavaScript 网络爬虫系统的关键技术问题。
%K JavaScript
%K AJAX
JavaScript
%K 程序切片
%K 网络爬虫
%K 有限状态机
%K AJAX
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=D4F6864C950C88FFCE5B6C948A639E39&aid=26C17E81AF8380AD63526C32C02DB9B1&yid=DE12191FBD62783C&vid=13553B2D12F347E8&iid=DF92D298D3FF1E6E&sid=954CE65414DD94CA&eid=73579BC9CFB2D787&journal_id=1003-3254&journal_name=计算机系统应用&referenced_num=0&reference_num=9