%0 Journal Article %T 基于聚类的S-KACA匿名隐私保护算法 S-KACA anonymity privacy protection based on clustering algorithm %A 毛庆阳 %A 胡燕 %J 武汉大学学报(工学版) %D 2018 %X KACA是一种基于局域泛化的K-匿名化方法.基于该算法,结合敏感属性隐私保护度,提出了一种S-KACA算法.该算法能够更有针对性地保护敏感隐私属性,而且使发布后数据的可用性较高,但由于其在保护敏感隐私信息时设置了一个隐私保护度的参数,会影响算法执行效率,使大规模的数据集应用有一定的局限性.为解决这个问题,引入一个高效的聚类算法——K-Prototypes算法,并将其与S-KACA算法相结合,提出一种K-Prototypes-SKACA算法.该算法首先通过聚类算法K-Prototypes将整个微数据集划分成几个较大的簇,然后再采用S-KACA算法对这些簇的微数据进行匿名化处理.实验验证K-Prototypes-S-KACA算法在隐私保护程度和数据可用性的大小与S-KACA算法相近,但是算法运行效率却得到了很大的提高 %K K-匿名 %K 敏感隐私保护度 %K 聚类算法 %K KACA算法 %K K-Prototypes-S-KACA算法 %U http://wsdd.cbpt.cnki.net/WKC/WebPublication/paperDigest.aspx?paperID=026bfd6b-ba7a-4eaf-8414-6cecec40bf00