%0 Journal Article %T 流水行云:支持可扩展的并行分布式流处理系统 %A 张鹏 %A 刘庆云 %A 谭建龙 %A 李焱 %A 杜华明 %J 电子学报 %P 639-646 %D 2015 %R 10.3969/j.issn.0372-2112.2015.04.003 %X 数据流处理系统,无论是集中式还是分布式,都需要克服单点瓶颈问题.不仅如此,如果数据流处理系统是静态配置的,那么还会出现处理节点供给不足或者过剩的情况,为此本文提出了一种支持可扩展的并行分布式数据流处理系统—流水行云,该系统根据有状态算子将查询拓扑划分为并行处理的子查询,并且通过有状态算子的分发器和收集器实现了数据流的保序,同时最大化减少并行处理的通信开销,不仅如此,结合负载均衡和重配置的可扩展技术使得该系统能够根据输入负载动态调整处理节点的负载和个数.60个节点组成的集群的实验证明了该系统的可扩展能力. %K 流处理系统 %K 可扩展 %K 有状态算子 %K 负载均衡 %K 重配置 %U http://www.ejournal.org.cn/CN/abstract/abstract8367.shtml