|
计算机科学 2002
A Method Based on Separating Hyper Surface and Its Applications in Massive Data Classifying
|
Abstract:
1 引言人的智慧中一个很重要的方面是从实例学习的能力,通过对已知事实的分析总结出规律,预测不能直接观测的事实。在人们对机器智能的研究中,用机器(计算机)来模拟这种学习能力,这就是我们所说的基于数据的机器学习问题,它是现代智能技术中的重要方面,其研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测(分类)。统计机器学习理论为机器学习问题建立了一个较好的理论框架,也发展了一种新的通用学习算法一支持向量机(SVM),其关键思想是将在低维空间非线性可分的数据通过非线性函数(核函数)映射到一个非常高维的特征空间,并在这个新的线性空间构筑分类超平面。这一结果相应于原始空间就是通过分类超曲面进行分类判别。