|
软件学报 2006
一种并行xml数据库分片策略, PP. 770-781 Keywords: 并行数据库,xml文档,工作负载,数据分片,媒介节点 Abstract: 主要研究xml文档的并行数据分片策略,以便能够并行处理xml查询.为了描述xml数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵xml数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵xml数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个np-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的xml数据分片算法win(workload-awareintermediarynodesdataplacementstrategy).大量实验结果证明:win算法的性能要优于以往的并行xml数据分片策略.
|