|
- 2004
数据流中频繁模式的评估与维护Keywords: 数据流挖掘 抽样 频繁模式 Hoeffding bounds 启发式方法 Abstract: 研究了数据流中频繁模式的挖掘问题,主要贡献在于:(1)基于启发式思想方法和抽样理论的基础上,提出了基于数据流样本集的分步模式估计方法;(2)算法求解所有长度的模式,而不仅仅是单项集模式;(3)为了找到满足精度要求的恰当的数据流样本集长度,引入了Hoeffding bound理论,并进行了修正,从而使之更适合于这一问题:(4) 提出了对估计模式进行在线维护的方法.基于上述方法的基础上,提出了模式估计和维护算法.最后,通过和已有算法进行实验对比分析,结果表明,该算法在结果精度、空间、时间复杂性等方面都适合进行数据流的分析
|