%0 Journal Article %T 基于质心距离和密度网格的数据流聚类算法 %J 南京邮电大学学报(自然科学版) %D 2017 %X 针对基于密度网格的数据流聚类算法D-Stream存在的缺陷,提出了基于质心距离和密度网格的数据流聚类算法CDD-Stream。该算法分为在线、离线以及历史簇查询3个部分。在线部分通过各网格单元的数据量、密度以及存在的网格数来计算加权平均密度,基于加权平均密度动态设置网格单元的密度阈值和时间间隔gap;采用新的簇边界判定方法,依据稀疏网格与其邻接稠密网格的质心距离,将稀疏网格归并到相应的簇中,在一定程度上避免了簇边界的误删,提高了聚类精度。离线部分使用金字塔时间模型存储网格帧,供用户查询历史簇,查询结果可以为用户进行簇演化分析提供依据。与D-Stream算法和NDD-Stream算法的对比实验结果表明,CDD-Stream算法在数据流对象上有更好的聚类时效性和更高的聚类精度。 %K 质心距离 密度网格 数据流 聚类 金字塔时间模型 %U http://nyzr.njupt.edu.cn/ch/reader/view_abstract.aspx?file_no=201701015&flag=1