%0 Journal Article %T MapReduce框架下的不确定数据Top-k查询计算 %A 卢鑫 %A 陈华辉 %A 董一鸿 %A 钱江波 %J 模式识别与人工智能 %P 695-700 %D 2013 %X Top-k查询是不确定性数据管理中普遍采用的一种技术。基于参数化排名函数的Top-k查询语义是近年来提出的各种查询语义的统一。文中针对海量不确定数据,提出一种基于MapReduce框架的Top-k计算的有效方法。通过分析基于参数化排名函数的不确定数据Top-k查询语义,设计一种获得未计算元组的排名函数值上界的算法,避免计算所有元组的排名函数值,解决Top-k计算中的剪枝问题。在MapReduce计算模型中提出两种不同的策略来实现该算法。文中针对单机环境和Hadoop分布式计算平台进行两组不同的对比实验。实验表明在处理海量不确定数据时,该算法在计算时间上有较高的性能提升。 %K 不确定数据 %K Top-k查询 %K MapReduce %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract9637.shtml