%0 Journal Article %T Double-Layer Reduction Method Optimizes The Large Scale SVM Social Spam Detection Model
用双层减样法优化大规模SVM垃圾标签检测模型* %A 覃希 %A 苏一丹 %J 计算机应用研究 %D 2011 %I %X 针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称双层减样法。数据减样时,双层减样法从粗、细粒度两个层次削减样本。粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集。细粒度约减时,以点为单位挑选剩余点集中的支持向量。实验表明,双层减样法能有效的压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度。将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度。双层减样法是将“粒度”和“层次”的概念引入减样法中,在约减时适时改变约减幅度。这比传统减样法更具有优势。 %K Folksonomy %K 垃圾标签 %K 支持向量机 %K 双层减样法 %K 约减 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=4F1C0F57A55372234C5B4E020BE7D39D&yid=9377ED8094509821&vid=D3E34374A0D77D7F&iid=B31275AF3241DB2D&sid=938DF4F02EA7B2E0&eid=E76352A43E934A0F&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=12