%0 Journal Article %T 云环境下海量空间矢量数据并行划分算法<br>Parallel Algorithm for Partitioning Massive Spatial Vector Data in Cloud Environment %A 姚晓闯 %A 杨建宇 %A 李林 %A 叶思菁 %A 郧文聚 %A 朱德海< %A br> %A YAO Xiaochuang %A YANG Jianyu %A LI Lin %A YE Sijing %A YUN Wenju %A ZHU Dehai %J 武汉大学学报·信息科学版 %D 2018 %R 10.13203/j.whugis20160271 %X 空间数据划分是空间大数据索引方法及其数据存储的重要组成部分。针对Hadoop云计算平台在空间数据划分及其存储方面的不足,提出了基于Hilbert空间填充曲线的海量空间矢量数据并行划分算法。在数据划分阶段,充分考虑空间数据相邻对象的空间位置关系、空间对象的自身大小以及相同编码块的空间对象个数等影响因素;通过“合并小编码块,分解大编码块”的划分原则,实现了云环境下海量空间矢量数据的并行划分算法。试验表明,该算法不仅能够提高海量空间矢量数据的索引效率,同时也能够很好地解决空间矢量数据在Hadoop分布式文件系统(Hadoop distributed file system,HDFS)上的数据倾斜问题 %K 矢量数据 %K Hilbert编码 %K 空间数据划分 %K MapReduce %K R-tree索引 %K 数据倾斜 %K < %K br> %K vector data %K Hilbert code %K spatial data partitioning %K MapReduce %K R-tree index %K data skewness %U http://ch.whu.edu.cn/CN/abstract/abstract6158.shtml