|
江苏科技大学学报(自然科学版) 2012
边界检测快速svdd算法Abstract: ?svdd要求一个包含目标数据的尽可能小的球体.与svm类似,这个球体由少部分支持向量决定.对于一个有限数据集,支持向量是位于数据分布边缘的少部分样本.这样的样本可以根据样本与其近邻的差和样本之间夹角的余弦和来判断.由于样本的近邻分布具有不对称性,通常靠近数据分布边缘的样本的余弦和接近于±k,而位于数据分布内部样本的余弦和接近于0.根据余弦和可以去除大量位于数据分布内部的样本,而对最后的学习结果没有什么影响.这样可以在一定程度上缓解svdd求解二次规划造成的时间和内存开销过大的问题.实验结果表明,在仅保留5%~9%的边缘样本学习得到的数据描述与用整个数据集获得的数据描述仅有微弱的差别,速度几乎可以提高2个数量级.
|