oalib

OALib Journal期刊

ISSN: 2333-9721

费用:99美元

投稿

时间不限

2017 ( 2 )

2016 ( 435 )

2015 ( 15206 )

2014 ( 15394 )

自定义范围…

匹配条件: “张理论” ,找到相关结果约226845条。
列表显示的所有文章,均可免费获取
第1页/共226845条
每页显示
交替方向隐式cfd解法器的gpu并行计算及其优化
邓亮,徐传福,刘巍,理论
计算机应用 , 2013,
Abstract: ?交替方向隐格式(adi)是常见的偏微分方程离散格式之一,目前对adi格式在计算流体力学(cfd)实际应用中的gpu并行工作开展较少。从一个有限体积cfd应用出发,通过分析adi解法器的特点和计算流程,基于统一计算架构(cuda)编程模型设计了基于网格点与网格线的两类细粒度gpu并行算法,讨论了若干性能优化方法。在天河-1a系统上,采用128×128×128网格规模的单区结构网格算例,无粘项、粘性项及adi迭代计算的gpu并行性能相对于单cpu核,分别取得了100.1、40.1和10.3倍的加速比,整体adicfd解法器的gpu并行加速比为17.3
层子模型中准二体反应的共振衰变角分布
理论小组
物理 , 1972,
Abstract: ?本文利用层子模型研究了高能强子准二体反应的共振衰变角分布和角关联,得到了同一个反应的各个统计张量之间的若干关系,这些关系与实验符合得较好.在理论上没有非相对论“夸克”模型在自旋参考系方面的困难.
结构网格CFD应用程序在天河超级计算机上的高效并行与优化
王勇献,理论,车永刚,徐传福,刘巍,程兴华
电子学报 , 2015, DOI: 10.3969/j.issn.0372-2112.2015.01.007
Abstract: 对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性.
基于并行可扩展科学计算工具集求解grapes全球非静力模式亥姆霍兹问题
理论,宋君强?,赵文涛?,胡江林?
气象学报 , 2011, DOI: 10.11676/qxxb2011.037
Abstract: 亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(petsc)的grapes全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对grapes在用解法器、代数多重网格、并行不完全lu分解(euclid)及加性schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示petsc结合高性能预条件库的并行方案是解决grapes模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于grapes现有解法器,更适用于更高精度和较大规模并行计算。
cpu/gpu协同并行计算研究综述
卢风顺,宋君强,银福康,理论
计算机科学 , 2011,
Abstract: cpu/gpu异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。cpu/gpu协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将cpu/gpu协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。
热烈欢呼认真学习
人口理论
人口研究 , 1977,
Abstract: ?<正>《毛泽东选集》第五卷的出版是我国人民政治生活中的一件大事,也是马克思主义发展史上的一件大事。在这一卷里,汇集了毛主席一九四九年到一九五七年的重要著作,是这段时期毛主席领导我们进行伟大革命斗争的胜利记录,是这段时期我国社会主义革命和社会主义建设丰富经验的科学总结。在这些著作里毛主席分析了社会主义社会的矛盾、阶级和阶级斗争,揭示了社会主义社会的发展规律,创立了无产阶级专政下继续革命的伟大理论。这些都
我国有计划控制人口增长速度问题
人口理论
人口研究 , 1977,
Abstract: ?<正>在社会主义社会,人口究竟怎样发展,这是摆在马克思列宁主义者面前的一个新课题。恩格斯曾预言:“如果说共产主义社会在将来某个时候不得不象已经对物的生产进行调整那样,同时也对人的生产进行调整,那末正是那个社会,而且只有那个社会才能毫无困难地做到这点。”这里恩格斯虽然明确指出了,如果社会主义和共产主义社会需要有计划调节人
Uniprocessor Performance Tuning of a Structured Grid Based Parallel CFD Application
一个结构网格并行CFD程序的单机性能优化

车永刚,理论,王勇献,徐传福,刘巍,王正华,刘化勇
计算机科学 , 2013,
Abstract: 从单机性能优化角度对一个高阶精度结构网格CFI)并行程序进行了优化。通过识别关键变量并对其进行 常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓 存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以 优化访存性能。在国家超算长沙中心“`Tianhe—lA',并行机上的测试结果表明,相对于采用Intel编译器最高优化级别 的版本,其对10。万网格点二维翼型算例,串行程序性能提高约22.2%-28.9%;对1. 12亿网格点三角翼算例,并行 程序性能提高约13.9%-20.2%。
一个结构网格并行cfd程序的单机性能优化
车永刚,理论,王勇献,徐传福,刘巍,王正华,刘化勇?
计算机科学 , 2013,
Abstract: 从单机性能优化角度对一个高阶精度结构网格cfi)并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心“`tianhe—la',并行机上的测试结果表明,相对于采用intel编译器最高优化级别的版本,其对10。万网格点二维翼型算例,串行程序性能提高约22.2%-28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%-20.2%。
儒法两条路线的一场大辩论——读祖冲之《辩戴法兴难新历》
力学教研组理论小组,数学教研组理论小组
物理学报 , 1975,
Abstract: 公元464年,在南朝宋孝武帝时,展开了一场关于历法问题的大辩论。这不是一般的学术辩论,而是儒法两条路线斗争在科学技术领域内的深刻反映。斗争的一方是站在法家立场上创造新历的我国杰出科学家祖冲之,另一方是站在儒家立场上,反对新历的代表人物戴法兴。斗争的实质是主张革新前进还是坚持守旧倒退;主张唯物主义还是坚持唯心主义的两条路线、两种世界观的斗争。
第1页/共226845条
每页显示


Home
Copyright © 2008-2017 Open Access Library. All rights reserved.