|
计算机科学 2004
基于web的数据采集Keywords: 数据采集web技术htmlxmljava锚 Abstract: 在本文中,将讨论使用标准web技术——html、xml和java——开发的一种基于web的数据采集方法。万维网是到目前为止世界上最丰富和最密集的信息来源,但其结构使它很难用系统的方法来利用信息。本文描述的方法主要是通过设定目标锚并利用xalan技术在源信息里获取目标数据,最后生成xml文档。这种方法可使那些熟悉web最常用技术的开发人员能快速而便捷地获取他们所需的以web方式发布的信息。
|