|
计算机应用 2009
面向多维混合型数据分布的混合多维直方图初探Keywords: 多维直方图,数据相关性,值域密度,混合型多维数据分布 Abstract: ?现实世界中,多维数据分布常常不是单一一种类型,而是在不同的数据区域中呈现不同类型的数据分布。提出了一种面向多维混合型数据分布的混合多维直方图coca*-hist方法。这种方法在给定的空间预算下,根据数据分布空间不同的区域中的数据分布类型,可以包含多种不同类型的直方桶,从总体上提高直方图的准确性。由于需要对创建多维直方图的树结构进行二次遍历,以识别不同类型的数据分布区域并进行空间预算的重分配,coca*-hist时间效率略低于mhist算法,但对因此获得的准确性的提高和面对不同数据分布类型的通用性来说,是可以接受的。
|