%0 Journal Article %T 类属数据的贝叶斯聚类算法 %A 陈黎飞 %J 计算机应用 %D 2017 %R 10.11772/j.issn.1001-9081.2017.04.1026 %X 摘要 针对类属型数据聚类中对象间距离函数定义的困难问题,提出一种基于贝叶斯概率估计的类属数据聚类算法。首先,提出一种属性加权的概率模型,在这个模型中每个类属属性被赋予一个反映其重要性的权重;其次,经过贝叶斯公式的变换,定义了基于最大似然估计的聚类优化目标函数,并提出了一种基于划分的聚类算法,该算法不再依赖于对象间的距离,而是根据对象与数据集划分间的加权似然进行聚类;第三,推导了计算属性权重的表达式,得出了类属型属性权重与其符号分布的信息熵成反比的结论。在实际数据和合成数据集上进行了实验,结果表明,与基于距离的现有聚类算法相比,所提算法提高了聚类精度,特别是在生物信息学数据上取得了5%~48%的提升幅度,并可以获得有实际意义的属性加权结果 %K 数据聚类 %K 类属型属性 %K 属性加权 %K 贝叶斯聚类 %K 概率模型 %U http://www.joca.cn/CN/abstract/abstract20417.shtml