|
中山大学学报(自然科学版) 2016
HBase时空查询算法研究Keywords: 时空数据,HBase,时空范围查询,kNN查询,Hilbert曲线 Abstract: 摘要 HBase是一种面向亿级规模的分布式键-值数据库,它能够提供在海量数据情况下的高效读写操作.然而由于HBase仅提供键-值模式的查询,因此无法满足面向时空应用的查询.现有工作的问题,第一,没有考虑时间维这一经常性的查询维度,第二,基本都是从设计HBase的schema出发设计row key来满足多维查询,这不能从根本上提高检索性能.针对这些不足,充分研究了HBase的内部索引机制,提出基于meta机制、适合于时空检索的HST结构,利用了meta链表索引了空间和时间,在此基础上设计了时空范围查询和kNN查询,以及对应的并行算法.在真实数据集上进行实验,结果表明,相比较于现有工作,基于HST的HBase时空检索能力明显提高,能够支持HBase应用于海量时空数据查询
|