CUDA環境における高性能3次元FFT

Bibliographic Information

Other Title
  • CUDA カンキョウ ニ オケル コウセイノウ 3ジゲン FFT
  • High Performance 3-D FFT in CUDA Environment

Search this article

Abstract

NVIDIAの最新GPUがサポートするCUDA環境では共有メモリを用いたスレッド間のデータ共有と,自由度が高いメモリアクセスが可能である.我々はこのCUDA環境に適した高性能3次元FFTアルゴリズムを提案する.GeForce 8シリーズのGPUを用いた3次元FFTにおいて,CUFFTライブラリ1.1と比較して3.1∼3.3倍,最大79.5GFLOPSの演算性能を達成した.

CUDA environment, which is supported in latest NVIDIA GPUs, allows data sharing between threads using shared memory, and also provides more flexible memory accesses. We propose a high performance 3-D FFT algorithm for the CUDA environment. Using GeForce 8 series GPUs, we achieved a high performance up to 79.5GFLOPS at 3-D FFT, which is from 3.1 to 3.3 times the performance compared with the performance of CUFFT library 1.1.

Journal

Citations (2)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top