|
计算机应用 2010
基于距离的数据流离群点挖掘算法Keywords: 数据流,离群点,hoeffding定理,滑动窗口 Abstract: ?传统的离群点挖掘算法无法有效挖掘数据流中的离群点。针对数据流的无限输入和动态变化等特点,提出一种新的基于距离的数据流离群点挖掘算法。通过hoeffding定理及独立同分布中心极限定理,对数据流概率分布变化进行动态检测,利用检测结果自适应调整滑动窗口大小对数据流离群点进行挖掘。实验结果表明,该算法在人工数据集和真实数据集kdd-cup99中可以对数据流中的离群点进行有效挖掘。
|