|
计算机科学 2015
高效隐私保护频繁模式挖掘算法研究DOI: 10.11896/j.issn.1002-137X.2015.04.039 Abstract: 阐述了隐私保护数据挖掘的目标,即在获取有效的数据挖掘结果的同时,满足用户对隐私保护的要求。针对个体用户及组织用户的隐私保护,论述了不同的方法,并归纳出隐私保护数据挖掘中所采用的两种主流算法。改进了高效隐私保护关联规则挖掘算法(emask)中需要完全的数据库扫描并且进行多次比较操作的弊端,提出了基于粒度计算的高效隐私保护频繁模式挖掘算法(bemask)。该算法将关系数据表转换成面向机器的关系模型,数据处理被转换成粒度计算的方式,计算频繁项集变成了计算基本颗粒的交集。特别是数据的垂直bitmap表示,在保证准确性不降低的情况下,一方面减少了i/o操作的次数,另一方面较大地提高了效率。
|