|
软件学报 2008
基于聚类分解的高维度量空间索引b+-tree, PP. 1401-1412 Keywords: 高维空间,索引结构,查询代价模型,聚类分割 Abstract: 为了提高索引性能,高维度量空间索引通常采用k-means等聚类技术来获取数据的分布信息.但是,已知的工作需要根据经验来确定聚类参数,缺乏对聚类与查询性能之间关系的理论分析.提出了一种基于聚类分解的高维度量空间b+-tree索引,通过聚类分解,对数据进行更细致的划分来减少查询的数据访问.对聚类与查询代价的关系进行了讨论,通过查询代价模型,给出了最小查询代价条件下的聚类分解数目等理论的计算方法.实验显示,提出的索引方法明显优于idistance等度量空间索引,最优聚类分解数的估计接近实际最优查询时所需的聚类参数.
|