搜索结果: 1-15 共查到“CUDA”相关记录27条 . 查询时间(0.062 秒)
2017中国医师协会泌尿外科医师分会(CUDA)年会
泌尿外科 泌尿外科事业
2017/3/17
由中国医师协会、中国医师协会泌尿外科医师分会主办,四川省医师协会、四川大学华西医院承办的2017中国医师协会泌尿外科医师分会(CUDA)年会将于2017年6月16-18日在“天府之国”成都世纪城新国际会展中心召开。本届大会是中国泌尿外科领域高级别的全国性会议,将邀请众多国内外著名的专家学者与广大泌尿外科医师齐聚一堂,通过举办专题报告、视频转播、互动会场和各专业委员会会议等丰富多彩的形式,对当前国内...
NTRU Modular Lattice Signature Scheme on CUDA GPUs
NTRU digital signatures lattice techniques
2016/5/18
In this work we show how to use Graphics Processing Units (GPUs) with Compute Unified Device Architecture (CUDA) to accelerate a lattice based signature scheme, namely, the NTRU modular lattice signat...
Porting and optimizing MAGFLOW on CUDA
GPGPU modeling HPC parallel computation hazard lava
2015/8/27
The MAGFLOW lava simulation model is a cellular automaton developed by the Sezione di Catania of the Istituto Nazionale di Geofisica e Vulcanologia (INGV) and it represents the peak of the evolution o...
中国科学院近代物理研究所“CUDA研究中心”成立
中国科学院近代物理研究所 CUDA研究中心 NVIDIA
2014/6/24
继清华大学、中国科学院大学等高校和研究机构之后,英伟达公司(NVIDIA)授权在我国建立的第七家“CUDA(Compute Unified Device Architecture)研究中心”于2014年6月21日在中国科学院近代物理研究所揭牌成立。近代物理所徐瑚珊副所长主持成立大会,中科院副院长詹文龙及英伟达公司副总裁潘迪等出席会议。
提出和实现了一种基于遗传算法和CUDA(ComputeUnifiedDeviceArchitecture)技术的可逆逻辑并行综合方
法. 其特点是预先求出并存储可逆逻辑门的组态编码和真值表,通过可逆逻辑门的“定轨级联”构成染色体
暨可逆逻辑电路,在迭代中按照预期的逻辑功能和优化目标等部分并行地评估适应度,再利用选择、交叉、
变异等部分并行化遗传操作,逐步找到功能正确、性能优化的可逆逻辑电路....
基于CUDA实现经典功率谱估计
CUDA Matlab 经典功率谱 并行运算
2013/11/23
针对目前通常使用Matlab等软件调用CPU进行功率谱估计的现状,提出了一种借助于CUDA平台调用GPU并行计算功率谱的方法;根据经典功率谱估计方法的原理,实现了GPU进行功率谱估计,通过Matlab的C语言接口输出结果,并给出了程序执行流程;最后通过数据对比,显示了CUDA并行计算带来的性能优势。
基于MPI+CUDA的异构并行可压缩流求解器
消息传递接口 统一计算设备架构 异构计算 可压缩流
2016/6/6
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求...
基于MPI+CUDA的异构并行可压缩流求解器
消息传递接口 统一计算设备架构 异构计算 可压缩流
2016/7/14
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求...
基于CUDA的大型γ辐照装置通用并行排源算法
并行模拟植物生长算法 并行排源算法 GPU 大型&gamma 辐照装置
2013/4/19
本文利用CUDA执行模型实现了植物模拟生长算法的完全并行化,结合标准排源质量评价数学模型,得到了一种高效率的并行排源算法,对应的代码能运行在GPU上。在此基础上,利用若干不同规模的排源算例对新版本算法进行了测试。测试结果表明,在保持已有版本算法优点的基础上,新算法的计算效率相对CPU版本提升了500倍以上,相对CPU+GPU混合版本,也提升了30倍以上。对111 PBq以下装置,新算法的计算时间小...
转换波叠前时间偏移计算量巨大、耗费时间长,影响了多波多分量地震数据的处理效率,也限制了转换波技术在生产上的应用规模。目前转换波叠前时间偏移主要采取CPU集群计算方式,但CPU集群存在功耗大、占用空间大和维护成本高等缺点,为缩短偏移计算耗时和降低计算成本,本文提出一种基于CUDA技术的转换波Kirchhoff叠前时间偏移并行算法。应用理论数据和实际转换波数据在CPU和GPU测试平台对算法进行了对比验...
邻居搜索问题在CUDA上基于KD-TRIE方法的优化与实现
KD-TRIE k-最邻近结点算法 CUDA 图形处理器
2012/12/10
介绍如何在CUDA上搭建KD-TRIE,并对其进行搜索,使其能适应解决邻居搜索问题.实验结果表明,当搜索半径较小(如整个空间直径的0.01和0.001),数据规模较大(如106)时,使用KD-TRIE进行搜索的效果最佳,与蛮力算法相比可以达到加速比5 000~15 000倍的效果;当搜索半径较大时,加速比会相应减少.采取优化措施,可以提高加速比.
基于CUDA 的格子Boltzmann 方法: 算法设计与程序优化
格子Boltzmann 方法 CUDA 并行计算 GPU 优化
2013/8/29
格子Boltzmann 方法(LBM)由于其具有计算简单, 天然并行, 易于程序实现, 易于处理复杂边界等优点而成为流体建模和模拟的一种重要方法. LBM 的上述优点也使得其非常适合利用图形处理单元(graphic processing unit, GPU)进行大规模流体计算. 基于GPU 的CUDA(compute unified device architecture)编程平台, 首先设计了相...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
secure multiparty computation (SMC), Oblivious Transfer (OT), ECC, Graphic Processing Unit (GPU)
2011/3/10
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
implementation / secure multiparty computation (SMC) Oblivious Transfer (OT) ECC Graphic Processing Unit (GPU)
2012/3/29
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...
Fastplay-A Parallelization Model and Implementation of SMC on CUDA based GPU Cluster Architecture
implementation / secure multiparty computation (SMC) Oblivious Transfer (OT) ECC Graphic Processing Unit (GPU)
2012/3/29
We propose a four-tiered parallelization model for acceleration of the secure multiparty computation (SMC) on the CUDA based Graphic Processing Unit (GPU) cluster architecture. Specification layer is ...