GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化

椋木大地, 高橋大介

クリロフ部分空間法の収束性は浮動小数点演算の丸め誤差に影響されることがあり,倍精度演算の代わりに 4 倍精度演算を用いることで,収束までの反復回数を削減できる場合がある.ここで,4 倍精度演算を用いることで1反復あたりの実行時間が x 倍に増加したとしても,求解までに必要な反復回数が 1/x 倍より少なくなれば,倍精度演算で計算可能な問題においても,4 倍精度演算を用いることで求解を高速化することが可能であると考えられる.本研究ではクロリフ部分空間法の一種である Conjugate Gradient(CG) 法および Bi-Conjugate Gradient Stabilized(BiCGStab) 法について,4 倍精度浮動小数点演算を用いた実装を Tesla K20X GPU 上に行い,倍精度版の実装と性能を比較した.また,前処理として cuSPARSE ライブラリの単精度,倍精度 ILU(0) 前処理を適用した場合についても検討を行った.本稿では The University of Florida Sparse Matrix Collection から収集した疎行列において 4 倍精度演算を用いることで求解を高速化できた 4 つのケースを示し,反復回数を削減し求解を高速化する手段として,倍精度演算の代わりに 4 倍精度演算を用いる有効性について検討を行う.

GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について