%0 Journal Article %T 面向范畴类型数据的sIB算法 %A 叶阳东 %A 何锡点 %A 贾利民 %J 电子学报 %P 2165-2172 %D 2009 %X 本文针对sIB算法仅适用于共现数据的问题,提出了一种能够自动进行范畴类型数据分析的sIB算法:CD-sIB.该算法根据范畴类型数据的离散化表示、不同属性值有限的特征,进行数据的属性的拓展和二元化处理,基于属性值的出现进行X,Y的联合分布的计算,使得sIB算法可有效应用于范畴类型数据的分析.实验结果表明:CD-sIB算法相对于现有的面向范畴类型数据聚类模式分析的算法GAClust和K-modes具有明显的优势;CD-sIB算法在进行数据属性概化程度高、类数据分布相对平衡的范畴类型数据的分析中,在效率和精确度方面均很突出. %K IB理论 %K sIB算法 %K 范畴类型数据 %K 概化 %K 聚类 %U http://www.ejournal.org.cn/CN/abstract/abstract6311.shtml