oalib

OALib Journal期刊

ISSN: 2333-9721

费用:99美元

投稿

时间不限

2016 ( 129 )

2015 ( 4720 )

2014 ( 4770 )

2013 ( 4985 )

自定义范围…

匹配条件: “孙凝晖” ,找到相关结果约71134条。
列表显示的所有文章,均可免费获取
第1页/共71134条
每页显示
一种海量数据流应用并行优化模型
小涓?,,雷斌?
软件学报 , 2009,
Abstract: 计算进入了多核时代,处理器的发展不再由更快的主频带动,而是依靠增加片上的多个核心.但是,对于高性能应用来说,多核平台的并行处理由于缺少适合的并行程序开发工具还处于初始阶段,对应用的优化需要对底层线程结构的深入了解和正确使用.从海量数据流应用的特点出发,提出了三级流水多线程模型,它的线程同步机制没有竞争,并且实现了不同特征数据流的差别服务.然后,在遥感图像处理和骨干网网络入侵检测系设计中,应用了海量数据流应用模型,并在多个多核平台下对骨干网网络入侵检测系统进行了性能评价.对sparct1平台上的线程映射方法进行研究,测试了不同映射方法的性能,并归纳出应用在体系结构方面的特征;采用sunsparct1架构8核32线程服务器和曙光x86架构8处理器16核服务器对系统吞吐率进行了测试,实验结果都表现了良好的可扩展性;使用真实骨干网络流量记录文件回放产生的模拟流量,对比测试了模型应用前后数据流的服务时间,改进系统的响应时间获得了显著的提高;针对系统连接数大、负载重和处理多样性的特点,采用基于探针流的采样算法准确测试了在精确预测ip网段策略下系统的服务质量,同时也测试了增加服务质量优化后系统的延迟开销,实验结果表明,系统在引入较少延迟下提高了数据流的服务质量.
曙光5000高性能计算机多播网络的设计
曹政,王达伟,刘新春,
电子学报 , 2011,
Abstract: 本文介绍了曙光5000高性能计算机多播网络设计的关键技术.减少多播与单播/多播与多播间的网络竞争是降低多播延迟的主要途径之一,而无死锁则是保障多播操作正确完成的前提.为了解决死锁问题,本文提出了一种基于全局资源公告的死锁避免方法;为了获得较低的多播延迟,本文充分利用胖树拓扑特点,提出了一种基于重载交换机去除的多播路径选择策略.测试结果表明,在网络重载情况下,相比于已有多播路径选择算法,本文的路径选择策略可以获得近三倍的性能提升.对于many-to-many多播通信,曙光5000多播网络可以获得90%以上的多播吞吐率.
rna二级结构预测中动态规划的优化和有效并行
谭光明?,冯圣中?,
软件学报 , 2006,
Abstract: 基于最小自由能模型的方法是计算生物学中rna二级结构预测的主要方法,而计算最小自由能的动态规划算法需要o(n4)的时间,其中n是rna序列的长度.目前有两种降低时间复杂度的策略:限制二级结构中内部环的大小不超过k,得到o(n2×k2)算法;lyngso方法根据环的能量规则,不限制环的大小,在o(n3)的时间内获得近似最优解.通过使用额外的o(n)的空间,计算内部环中的冗余计算大为减少,从而在同样不限制环大小的情况下,在o(n3)的时间内能够获得最优解.然而,优化后的算法仍然非常耗时,通过有效的负载平衡方法,在机群系统上实现并行程序.实验结果表明,并行程序获得了很好的加速比.
无锁同步的细粒度并行介度中心算法
涂登彪?,谭光明?,
软件学报 , 2011, DOI: 10.3724/SP.J.1001.2011.03811
Abstract: 通过结合体系结构和算法进行研究发现,基于锁的同步机制是细粒度并行介度中心(betweennesscentrality,简称bc)算法在现有多核平台上高效执行的主要瓶颈.提出了一种消除锁同步的数据驱动(data-centric)并行算法,在amd32核smp和intel8核smp两个平台上获得了2倍左右的加速比.
Fine-grained Parallel Multi-pattern Matching for Backbone Network NIDS
面向骨干网NIDS的细粒度并行多模式匹配方法

邵宗有,刘兴奎,刘新春,
计算机科学 , 2013,
Abstract: As the network bandwidth continuously increases, the network security has been seriously threatened by malicious behaviors and risks. Network intrusion detection system (NIDS) is one of the efficient measures to cope with intrusion threats and protect information security, which employs pattern matching techniques to analyze incoming packs is and detect potential threats. However, pattern matching is such a compute-intensive task that most current techniques can't meet the demand of KIDS for backbone networks over lOGbps speed. We proposed a novel Bloom filter based approach for pattern matching, called PBPM (Parallel-Bloom-filter-based multi-Pattern Matching). PBPM employs multiple copies of the same Bloom filter to carry out parallel matching on different positions of the input text at the same time. The fine-grained parallel approach is able to skip multiple characters per clock when implemented on FPGAs, dramatically improving pattern matching performance. Experimental results on the rule set from Snort 2.9 show that the throughput of PBPM exceeds more than 20Gbps.
基于gpu的串匹配算法研究
张庆丹,戴正华,冯圣中,
计算机应用 , 2006,
Abstract: ?bf算法是串匹配算法中最基础的算法,但它是串行算法,不适合图形处理器(graphicprocessingunit,gpu)的体系结构。结合gpu的特殊体系结构,通过数据存取方式和计算策略的改进,充分利用了gpu的并行处理能力,从而基于gpu实现了bf算法。实验结果表明基于gpu的并行算法能够取得较好的加速比,同时也给出了在现有gpu架构上有效实现通用计算的瓶颈。
面向骨干网nids的细粒度并行多模式匹配方法
邵宗有,刘兴奎,刘新春,
计算机科学 , 2013,
Abstract: 随着网络带宽的快速增长,互联网正面临着日益严重的安全威胁。网络入侵检测系统(kids)利用模式匹配等技术对网络报文进行分析和检测,是防范网络威胁、保护网络安全的一种有效手段。但模式匹配消耗巨大的计算量,现有的技术难以满足10gbps以上骨干网络kids的需求。提出了基于b1oomfilter的细粒度并行模式匹配技术pbpm(parallel-b1oom-filter-basedmulti-patternmatching),pbpm利用多个相同的b1oomfilter分别从输入文本的不同位置处并行匹配,每个周期可完成多个字符的匹配,显著提高了匹配速率。详细讨论了在fpga上的实现方式,在snort2.9规则集上的测试结果表明,pbpm能够提供超过20gbps的模式匹配需求。
A Case Study: SLA Evaluation of an Information System
实例研究:一个信息系统的SLA评价

LI Hui,SUN Ning-hui,LI Xiao-lin,
李慧
,,李晓林

计算机应用研究 , 2005,
Abstract: SLA (Service Level Agreement) is a new approach of performance evaluaton. The design and implementation of SLA is given in the paper based on the information system of Institute of Computing Technology (ICT), Chinese Academy of Sciences. To illustrate the advantage of ICT information system, a new performance standard is provided. Compared with the traditional evaluation, the features of SLA system are given.
Design and implementation of multi-processor chipset based on Godson 2E CPU
龙芯2E多处理器芯片组的设计与实现*

FANG Zhi-bin,HU Peng,AN Xue-jun,SUN Ning-hui,
方志斌
,胡鹏,安学军,

计算机应用研究 , 2008,
Abstract: 提出了一种面向高性能计算机的多处理器芯片组的设计,其主要特点是支持多处理器通过芯片组和交换芯片两级互连,全局地址空间和多处理器同步支持。给出了芯片组的组成结构、设计原则和关键技术,设计并实现了基于龙芯2E处理器的多处理器芯片组。目前,已采用FPGA平台对该芯片组进行验证和测试,以该芯片组为核心的四处理器原型系统完成B IOS引导和操作系统运行,经过实测处理器的访问请求通过芯片组延迟小于0.5μs,芯片组内处理器通信带宽达到500 Mbps。
An Optimized and Efficiently Parallelized Dynamic Programming for RNA Secondary Structure Prediction
RNA二级结构预测中动态规划的优化和有效并行

TAN Guang-Ming,FENG Sheng-Zhong,SUN Ning-Hui,
谭光明
,冯圣中,

软件学报 , 2006,
Abstract: RNA secondary structure prediction based on free energy rules remains a major computational method in computational biology. Its basic dynamic programming algorithm needs O(n4) time to calculate the minimum free energy for RNA secondary structure, where n is the length of RNA sequence. There are two variants for handling this problem: either the internal loops are bounded by a maximal size k, giving a time complexity of O(n2×k2), or one uses the trick of Lyngso, which makes use of the rules of loop energies, to reduce time complexity to O(n3) for suboptimal free energy without restriction. Only with additional O(n) space, a new algorithm is proposed to eliminate the redundant calculation in the energy of internal loops and reduce the time complexity to O(n3) with unrestricted loop sizes for optimal free energy. While the optimized algorithm is time consuming, an efficient parallel algorithm with good load balancing in cluster systems is also proposed. The experimental results show that the parallel program achieves reasonable speedups.
第1页/共71134条
每页显示


Home
Copyright © 2008-2017 Open Access Library. All rights reserved.