|
计算机科学 2014
pbpp:列存储系统中基于传递块缓冲区的流水线并行处理DOI: 10.11896/j.issn.1002-137X.2014.06.028 Keywords: 多线程,多核,列存储,传递块缓冲区,并行处理中图法分类号tp311文献标识码a Abstract: 片上多核处理器(cmp)凭借其低功耗和低成本等优势迅速成为处理器市场的主角,它为多线程的实现提供了硬件支持。列存储技术在分析型应用中具有显著的优势。在列存储系统中,查询优化依然是最重要的问题之一。在列存储系统中,利用多核资源提高查询处理性能具有较大潜力。文中通过对查询执行器生成的物理查询树进行流水多线程设计,结合列存储的特点,建立传递块缓冲区,使主线程和辅助线程分别对传递块缓冲区读写,以提高查询性能。同时还提出使用操作系统中经典的“生产者和消费者”模式来解决线程之间的同步问题。提出的这些方法应用在实验室研发的列存储系统dwms中,使用数据仓库基准测试集ssb验证了这些方法的有效性。实验结果表明,传递块缓冲区的设计使sql的查询效率有了近50%的提升。
|