|
软件学报 2005
面向xpath执行的xml数据流压缩方法, PP. 869-877 Keywords: xml,数据流,压缩,dtd,xpath Abstract: 由于xml(extensiblemarkuplanguage)本身是自描述的,所以xml数据流中存在大量冗余的结构信息.如何压缩xml数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的xml数据压缩技术,都需要扫描数据多遍,或者不支持数据流之上的实时查询处理.提出了一种xml数据流的压缩技术xsc(xmlstreamcompression),实时完成xml数据流的压缩和解压缩,xsc动态构建xml元素事件序列字典并输出相关索引,能够根据xml数据流所遵从的dtd,产生xml元素事件序列图,在压缩扫描之前,产生更加合理的结构序列编码.压缩的xml数据流能够直接解压缩用于xpath的执行.实验表明,在xml数据流环境中,xsc在数据压缩率和压缩时间上要优于传统算法.同时,在压缩数据之上查询的执行代价是可以接受的.
|