%0 Journal Article %T 一种有效的挖掘数据流近似频繁项算法 %A 王伟平? %A 李建中? %A 张冬冬? %A 郭龙江? %J 软件学报 %P 884-892 %D 2007 %X 数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,挖掘出所有准确的数据流频繁项通常是不可能的.提出一种新的挖掘数据流近似频繁项的算法.该算法的空间复杂性为o(ε-1),每个数据项的平均处理时间为o(1),输出结果的频率误差界限为ε(1-s+ %K 数据流 %K 数据挖掘 %K 频繁项 %K ε-近似 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=20070411&flag=1