|
大连理工大学学报 2014
一种基于MapReduce的动态数据流分类算法DOI: 10.7511/dllgxb201404014, PP. 461-468 Keywords: 数据流分类,增量式学习,极端支持向量机(ESVM),MapReduce,遗忘因子,鲁棒性 Abstract: 当前动态数据流下的实时分类问题存在3个难点针对海量数据的实时处理;概念漂移的跟踪和模型的更新;模型的稳定和鲁棒性.针对上述问题,将极端支持向量机(extremesupportvectormachine,ESVM)与MapReduce框架结合,提出了带遗忘因子的鲁棒ESVM算法.该方法通过构造残差权重矩阵,对残差进行修正,同时加入遗忘因子,提高新样本的作用,从而实现对海量数据处理问题的求解.实验结果显示,所提出方法能够快速有效地对动态数据流进行分类,且结果不易受到噪声干扰,稳定性强.
|