%0 Journal Article %T 基于概率数据流的有效聚类算法 %A 戴东波? %A 赵杠? %A 孙圣力? %J 软件学报 %P 1313-1328 %D 2009 %X 提出一种在概率数据流上进行聚类的有效方法p-stream.p-stream针对数据流上的概率元组提出强簇、过渡簇和弱簇的概念,设计一种有效的在线候选簇选择策略,为每个不断到达的数据元组合理地找到可能归属的簇,并在每个检查点存储微簇快照,以便离线进一步高层聚类和演化分析.最后设计一个“积极”的二层聚类模型来判断现有的第1层聚类模型是否还适应数据流中最近到达的概率元组.实验采用kdd-cup’98和kdd-cup’99真实数据集以及变换高斯分布的人工数据集构造概率数据流.实验结果表明,p-stream具有良好的聚类质量、较快的处理速度,能够有效地适应数据演化情况. %K 概率数据流 %K 聚类 %K 演化分析 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=3303&flag=1