|
中山大学学报(自然科学版) 2016
一种拟合聚类结果的特征重要性评价方法Keywords: 聚类,类标签,特征相似性,拟合,特征选择 Abstract: 摘要 从使类内联系更紧密、类间联系更稀疏的角度考虑,特征选择可以转换为对聚类的特征选择问题.目前基于Filter的特征选择方法普遍从特征本身的特性考虑,强调特征的信息量、特征之间的依赖性和特征子集与分类结果的相关性,关注的重点在于消除冗余项、去除不相关项,虽然能取得不错的效果,但是这种效果本身是不可预知的,需要经过分类器训练得出.将特征选择问题转换成聚类问题是从整体的效果考虑,认为使得样本能够取得较好分类效果的特征子集在聚类上应当具有类似的效果,问题进一步转换成在特征集中寻找一个最优子集使得样本聚类的结果与分类标签最大程度拟合.这种转换一方面可以减少计算量,另一方面特征选择的效果在某种程度上是可预知的
|