|
计算机科学 2006
高维turnstile型数据流聚类算法Keywords: 数据流子空间聚类高维倾斜时间窗口 Abstract: 现有数据流聚类算法只能处理timeseries和cashregister型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维turnstile型数据流的子空间聚类算法ht-stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜时间窗口存储统计信息,根据用户指定时间跨度离线输出聚类结果。基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性。
|