%0 Journal Article %T 基于关联函数的数据流聚类算法 %A 潘丽娜 %A 王治和 %A 党辉 %J 计算机应用 %D 2013 %X ?传统数据流聚类算法大多基于距离或密度,聚类质量和处理效率都不高。针对以上问题,提出了一种基于关联函数的数据流聚类算法。首先,将数据点以物元的形式模型化,建立解决问题所需要的关联函数;其次,计算关联函数的值,以此值的大小来判断数据点属于某簇的程度;然后,将所提方法运用到数据流聚类的在线-离线框架中;最后,采用真实数据集kdd-cup99和随机生成的人工数据集进行算法的测试。实验结果表明,所提方法的聚类纯度在92%以上,每秒能处理约6300条记录,与传统算法相比,处理效率有了较大的提高,在维度和簇数目方面的可扩展性较强,适用于处理大规模的动态数据集。 %K 数据流 %K 聚类 %K 物元 %K 关联函数 %K 经典域 %K 节域 %U http://www.joca.cn/CN/abstract/abstract16174.shtml