OpenACC単一記述によるGPU+FPGA複合デバイス処理システム

書誌事項

タイトル別名
  • GPU+FPGA Multi-device Programming System by OpenACC

この論文をさがす

抄録

近年の高性能コンピューティング(HPC)では,アクセラレータとしてGPUとともにFPGAにも注目が集まっている.両デバイスの特性が大きく異なることから,我々は両者を融合して利用することで,複合的なシミュレーションに対し,より効率的な演算加速が行えると考えている.しかし,共通した表現によるGPUとFPGAのコード記述をユーザが容易に行える実用的な言語処理系は存在していない.また,現在のGPU市場をほぼカバーしているNVIDIA社製GPUについては,多くのアプリケーションはCUDAやOpenACCなどで記述されているが,コードの一部をFPGAに移植する際にこれらの言語を用いることはできない.FPGAを対象としたOpenACC処理系については一部の研究用コンパイラが存在するだけである.また,それぞれのアクセラレータを独立にプログラムすることができても,それらを結合するプログラミングフレームワークを提供する必要がある.そこで我々は,CAMP(Cooperative Acceleration by Multi-device Programming)というコンセプトの下,OpenACCを用いて,両アクセラレータを統一的にプログラミング可能な言語処理系を開発している.本論文では,宇宙物理分野の実アプリケーションを用いた本システムの評価について述べる.この評価ではGPUのみの手法に比べ,本手法が最大約10倍の高速化を達成した.

In the field of HPC in recent years, FPGAs have been focusing on in these days as another possible solution beside GPUs which are the main player of accelerated sueprcomputing. Since the performance characteristics of both devices are significantly different, we believe that more efficient acceleration can be achieved by using them in combination. However, at present, there is no practical language system that allows users to easily write code by common expression for GPUs and FPGAs. As for GPUs, NVIDIA's GPUs have a high market share, so many applications are written in CUDA or OpenACC, but these languages cannot be used when porting part of the code to FPGA. There are only some research compilers for the OpenACC processing system for FPGA. Also, even if each accelerator can be programmed independently, it is necessary to provide a programming framework that grammatically and semantically connects them. Under such a background, we launched a concept of CAMP (Cooperative Acceleration by Multi-device Programming), and have been developing a language processing system that programs both accelerators in a unified manner using OpenACC, a directive-based arithmetic acceleration programming API. In this paper, we describe evaluation of this system with a real application for astrophysics simulation. We successfully enhanced the performance up to 10 times faster than GPU-only solution.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ