%0 Journal Article %T 基于熵相关系数的关联性自动判别方法——coca %A 王珊 %A 曹巍 %A 覃雄派 %J 计算机应用 %D 2006 %X ?数据库自管理、自调优中查询计划的自动优化是目前的关注热点。为保证优化器估值精度,用统计学方法,给出了一种基于熵相关系数的对字段关联性的自动判别的新算法——coca。该算法有下列特点:(1)限制少,没有卡方检验的频数限制,卡方检验只有在列联表中至少有80%的格子频数大于5的情况下才可信;(2)结果多,卡方检验(cords)只判断字段之间是否有关联,新方法可计算字段之间双向的关联程度。实验表明,新方法更坚固,产生更多的统计信息,可以支持后面更高效、准确地建立直方图。 %K 查询优化 %K 统计信息 %K 关联性 %K 熵相关系数 %U http://www.joca.cn/CN/abstract/abstract9810.shtml