%0 Journal Article %T 基于web的数据采集 %A 唐翔弘 汪林林 文展? %J 计算机科学 %D 2004 %X 在本文中,将讨论使用标准web技术——html、xml和java——开发的一种基于web的数据采集方法。万维网是到目前为止世界上最丰富和最密集的信息来源,但其结构使它很难用系统的方法来利用信息。本文描述的方法主要是通过设定目标锚并利用xalan技术在源信息里获取目标数据,最后生成xml文档。这种方法可使那些熟悉web最常用技术的开发人员能快速而便捷地获取他们所需的以web方式发布的信息。 %K 数据采集web技术htmlxmljava锚 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=10708594&flag=1