oalib

OALib Journal期刊

ISSN: 2333-9721

费用:99美元

投稿

时间不限

2016 ( 175 )

2015 ( 5851 )

2014 ( 6116 )

2013 ( 6231 )

自定义范围…

匹配条件: “赵荣彩” ,找到相关结果约84957条。
列表显示的所有文章,均可免费获取
第1页/共84957条
每页显示
A Study on the Technology of Dynamic Multithread POOL in TCP Server
TCP Server的动态线程POOL技术研究

荣彩
计算机科学 , 2002,
Abstract: 一、引言在传统的Unix系统下,当一进程需要另一实体去完成某一子任务时,它就创建一个子进程进行处理。多年来,在U-nix系统下的大多数支持并行访问的网络Server都是按这种模式设计和运行的,当父进程接受到来自网络的一个Client的连接时,它就fork一个子进程,并由该子进程去处理这个Client的请求。这种方法存在两个问题: fork的开销比较大,要从父进程到子进程进行存储copy和复制父进程的各种描述等有关信息。并行实现中常采用copy-on-write优化技术来避免在fork时进行从父进程到子进程的立即数据复制,而是当子进程需要相应的数据时再进行复制。尽管如此,fork的开销仍然不能明显地减小。在fork后,需要进程间通信(IPC)在父子进程间进行信息传递。在fork之前,这种信息传递当然是容易的,因为它是在fork时进行直接复制的。但是,从子进程往父进程返回时就有大量的工作要做。
tcpserver的动态线程pool技术研究
荣彩
计算机科学 , 2002,
Abstract:
面向slp的多重循环向量化
魏帅?,荣彩,姚远?
软件学报 , 2012, DOI: 10.3724/SP.J.1001.2012.04106
Abstract: 如今,越来越多的处理器集成了simd(singleinstructionmultipledata)扩展,现有的编译器大多也实现了自动向量化的功能,但是一般都只针对最内层循环进行向量化,对于多重循环缺少一种通用、易行的向量化方法.为此,提出了一种面向slp(superwordlevelparallelism)的多重循环向量化方法,从外至内依次对各个循环层次进行分析,收集各层循环对应的一些影响向量化效果的属性值,主要包括能否对该循环进行直接循环展开和压紧、有多少数组引用相对于该循环索引连续以及该循环所包含的区域等,然后根据这些属性值决定在哪些循环层次进行直接循环展开和压紧,最后通过slp对循环中的语句进行向量化.实验结果表明,该算法相对于内层循环向量化和简单的外层循环向量化平均加速比提升了2.13和1.41,对于一些常用的核心循环可以得到高达5.3的加速比.
simd向量指令的非满载使用方法研究
徐金龙 荣彩 博?
计算机科学 , 2015, DOI: 10.11896/j.issn.1002-137X.2015.07.049
Abstract: 大规模simd体系结构提供了更强的向量并行硬件支持,但是,大量迭代次数不足的循环由于不能提供足够的并行性,难以用等价的向量方式实现。为了更有效地利用simd,提出了一种非满载地使用simd指令的向量化方法。研究了向量寄存器的使用方式,基于非满载的向量寄存器使用方式实现了非满载的向量操作和短循环的向量化,并将非满载的向量化方法用于一般循环的向量化。提供了收益分析方法来为本向量化方法作精确指导。实验结果表明了该方法的有效性,所选测试用例的目标循环被向量化,平均加速比达到1.2。
Automatic Computation and Data Decomposition Algorithm Based on Dominant Value
基于主导值的计算和数据自动划分算法

丁锐,荣彩,韩林
计算机科学 , 2012,
Abstract: Automatic computation and data decomposition are an optimization technique that distributes computations and data onto different processors. The decomposition result has a direct impact on the performance of program's paral- lelization. Array is one of main targets of treatment for the decomposition algorithm, and some profits of them are not e- nough after parallclization, but it will bring constraints and disrupt the other distribution of array, leading to large a- mounts communication of data re-distribution. The decomposition algorithm in existing has no agreement in the order of array distribution, therefore can't restrict propagation of constraint of array' s parallelization, reducing performance of optimized parallel code automatically generated by the back-end compiler. This paper presented an automatic computa- tion and data decomposition based on the dominant values. Algorithm quantified the impact of array on the programs' parallelism as the dominant value, and agreed priorities of distribution based on the size of the dominant values of array, limited the spread speed of constraints of interference array, improved the reasonableness of decomposition results. Ex- perimental results show that the algorithm can get good decomposition results.
Data Regroup and Alignment Optimization Based on SIMD
面向SIMD的数组重组和对齐优化

魏帅,荣彩,姚远,侯永生
计算机科学 , 2012,
Abstract: 随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。针对实际应用中出现的数组引用不连续的情况,提出了一种数学模型,用以刻画数组的访存模式和数据重组方案,以判断这些数组引用是否可以通过数组转置的方法满足连续性要求;并采用过程间数组填充、循环剥离和基于SI_P的向量化代码生成方法等进行对齐优化。最后基于SPEC2000测试集对该算法进行了测试,结果表明,该方法可以有效地提升向量化程序的执行效率。
一种基于数组生命期的数据分解算法
丁锐?,荣彩,韩林?
软件学报 , 2013, DOI: 10.3724/SP.J.1001.2013.04405
Abstract: 划分是一种自动分配计算和数据到各个处理器的编译技术,是分布存储结构下并行编译的核心问题.以往的划分研究较少从生命期的角度考虑数据分解问题,分解在数组的不同生命期中不一致时会产生冗余通信.为解决上述问题,提出了一种数据分解算法,通过定义-引用图来表示数组的数据流信息,并使用分解映射表为数组不同的生命期建立各自的数据分解.对矩阵求逆等9个实际用例的实验结果表明,与以往不区分生命期的划分研究相比,使用所提算法能够在寻找数据分解时对并行收益做出更准确的评估,减少了通信冗余,从而提升了自动生成的并行代码的加速比.
基于依赖分析的spmd程序隐式同步检测及处理算法
岳峰?,庞建民?,荣彩
软件学报 , 2013, DOI: 10.3724/SP.J.1001.2013.04343
Abstract: spmd翻译是指将一种特定类型的spmd程序编译到多种设备上,当前的细粒度spmd翻译研究建立在线程之间相互独立的假定上,线程之间只通过显式同步进行通信.但线程之间还隐含存在着各种数据依赖,如隐式同步,这导致了spmd翻译在处理隐式同步时的正确性缺陷.为了对隐式同步进行处理,对细粒度spmd模型cuda中的隐式同步进行了系统的分析,指出了当前翻译cuda程序到多核平台的相关研究在处理隐式同步上的不足,提出了基于依赖分析的隐式同步检测方法.在检测出隐式同步的基础上,设计了循环重排序的优化处理算法,对显式同步和隐式同步进行了统一处理.实验结果表明,与现有的spmd翻译方法相比,该检测及处理算法能够正确而快速地检测并翻译cuda中的各种隐式同步,代价较小,有助于编译器产生正确而有效的翻译结果.
分段约束的超字并行向量发掘路径优化算法
徐金龙,荣彩,韩林
计算机应用 , 2015,
Abstract: ?超字并行(slp)是一种针对基本块的向量并行发掘方法,结合循环展开可以发掘更多的并行性,但同时也会产生过多的发掘路径。针对上述问题,提出了一种分段约束的slp发掘路径优化算法;采用分段的冗余删除方法,来保证冗余删除后段的同构性。采用段间的slp发掘,来约束发掘路径;最后进行pack调整来处理访存重叠的情况。实验结果表明,该方法有效增强了slp向量化功能,对于测试程序,向量化的平均加速比接近2。
二进制翻译中的库函数识别技术研究
齐宁,付文,荣彩
计算机应用 , 2006,
Abstract: ?体系结构的不断发展给软件开发者带来了巨大的风险,造成了新体系结构推广的困难,而二进制翻译技术使得可执行代码可自动迁移到新的体系结构。介绍了在开发一个静态二进制翻译系统(i2a翻译系统)中的库函数识别技术,并提出了解决库函数识别问题的新的方法。基于ia-64体系结构的调用约定及实例分析证明,该方法是一种简单实用的库函数识别方法,经i2a系统验证是有效的。
第1页/共84957条
每页显示


Home
Copyright © 2008-2017 Open Access Library. All rights reserved.