|
中山大学学报(自然科学版) 2016
基于粗糙集成学习的半监督属性约简Keywords: 属性约简,粗糙集,自训练,半监督学习,半监督数据 Abstract: 摘要 属性约简是粗糙集理论重要研究内容之一.Pawlak粗糙集约简的对象一般是有监督数据或者是无监督数据.而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据.仅利用有标记数据一般难以计算出质量较好的属性约简.为此,基于粗糙集理论,结合集成学习与半监督学习,提出有效地利用无标记数据计算半监督数据属性约简算法.该算法在有标记数据上构造一组差异性较大的属性约简构造集成基分类器,在半监督自训练学习过程中,用集成分类器对无标记数据做出预测,扩大有标记数据集,从而获得质量更好的约简.UCI数据集实验分析表明该算法是有效可行的.
|