基于免参数据挖掘的相异度度量研究
Keywords: 免参数据挖掘,kolmogorov复杂度,压缩算法,相异度度量,层次聚类
Abstract:
?由于参数设置导致数据挖掘结果异常的例子很多,为了解决这一问题,出现了免参数据挖掘思想。对kolmogorov复杂度理论进行了研究,将其和免参数据挖掘思想相结合,提出了一种基于压缩的相异度度量scdm。由于压缩算法是空间和时间高效性算法,使得应用该算法的相异度度量也具有较好的性能。实验表明将这种相异度度量应用到层次聚类算法中,其聚类的准确率也较高。
Full-Text