|
计算机科学 2001
A Set Operation Based Algorithm for Association Rules Mining
|
Abstract:
1 引言近年来,随着商业、政府和科学数据库的急剧增长和存贮设备的不断升级,给我们带来了大量的数据。面对这“堆积如山”的数据,用传统的数据分析手段无法理解并有效地利用它们。人们希望找到能够自动地、智能地理解分析它们的方法,于是就出现了数据采掘技术。它的提出为我们有效识别出存在于这些数据中的有效的、新颖的、具有潜在效用的乃至最终可理解的模式提供了可靠的科学方法,并成为当今国际人工智能和数据库等领域新兴且热门的研究课题。在事务数据库中发现关联规则是由R·Agrawal等人首先提出的。目前己成为数据采掘领域中的一个非常重要的研究课题。有一个关联规则的例子就是“面包牛奶(20%,80%)”,其直观意义为在所有的购买交易中,同时购卖面包与牛奶的概率为20%,在所有购卖面包的交易中有80%交易同时也购买牛奶。关联规则的应用主要包括顾客购物分析、目录设计、商品广告邮寄分析、追加销售、仓储规划、网络故障分析等。