OpenACCによる共役勾配法カーネルコードの並列化と実行性能評価

書誌事項

タイトル別名
  • Parallelization and Evaluation of Conjugate Gradient Method's kernel code using OpenACC

抄録

近年,HPC 分野では様々な並列計算機が登場しており,効率的にプログラムの並列化をする手法が検討されている.特に GPU の利用には専用開発環境 CUDA を用いる必要があるため開発の敷居が高いとされていたが,ディレクティブを記述するだけで GPU が利用可能となる OpenACC が登場した.しかしながら,OpenACC は発展途上の手法であり CUDA での実装や他の並列計算機との比較研究が少ない.本研究の目的は,連立一次方程式ソルバーの1つである共役勾配法のカーネルコードを OpenACC を用いて並列化した際の実行性能を各環境で評価することである.評価には共役勾配法のカーネルコードに対して OpenACC, OpenMP, CUDA を適用し, Xeon (Skylake), GPU (P100), FX100 環境を用いて実行性能の比較を行う. 結果,FX100 に対し OpenACC を用いた P100 の実行性能は3.6倍以上の高速化を達成した.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ