|
计算机科学 2009
一种应用于中文文本聚类的适应值函数Keywords: 适应值函数遗传算法文本聚类数据挖掘 Abstract: 文本聚类中的文本对象一般都是高维的,类的大小、密度各不相同,给聚类带来了很大难度。目前国内针对这些问题而提出的应用于遗传算法的适应值函数却很少,国外的通用目标函数比较复杂,而且在文本聚类上的效果一般。针对文本对象的特征提出了一种应用于遗传算法的适应值函数,它具有结构简单、易于计算、适用于高维对象的特点,并且能够帮助遗传算法更好避免陷入局部最优,达到比较准确地描述聚类结果的目的。通过实验与csmeas—tire相比,聚类结果更优。
|