%0 Journal Article %T 基于hadoop的高效连接查询处理算法chmj %A 赵彦荣? %A 王伟平? %A 孟丹? %A 张书彬? %A 李均? %J 软件学报 %P 2032-2041 %D 2012 %R 10.3724/SP.J.1001.2012.04124 %X 提出了一种并行连接查询处理算法colocationhashmapjoin(chmj).首先,设计了多副本一致性哈希算法,将具有连接关系的表根据其连接属性的哈希值在机群中进行分布,在提升了连接查询处理中数据本地性的同时,保证了数据的可用性;其次,基于多副本一致性哈希数据分布,提出了hashmapjoin并行连接查询处理算法,有效地提高了连接查询的处理效率.chmj算法在腾讯公司的数据仓库系统中进行了应用,结果表明,chmj连接查询的处理效率比hive系统提高了近5倍. %K 大数据 %K hadoop %K 连接查询处理 %K hashmapjoin %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=4124&flag=1