GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化

  • 椋木大地
    筑波大学大学院システム情報工学研究科|日本学術振興会特別研究員DC
  • 高橋大介
    筑波大学システム情報系

この論文をさがす

抄録

クリロフ部分空間法の収束性は浮動小数点演算の丸め誤差に影響されることがあり,倍精度演算の代わりに 4 倍精度演算を用いることで,収束までの反復回数を削減できる場合がある.ここで,4 倍精度演算を用いることで1反復あたりの実行時間が x 倍に増加したとしても,求解までに必要な反復回数が 1/x 倍より少なくなれば,倍精度演算で計算可能な問題においても,4 倍精度演算を用いることで求解を高速化することが可能であると考えられる.本研究ではクロリフ部分空間法の一種である Conjugate Gradient(CG) 法および Bi-Conjugate Gradient Stabilized(BiCGStab) 法について,4 倍精度浮動小数点演算を用いた実装を Tesla K20X GPU 上に行い,倍精度版の実装と性能を比較した.また,前処理として cuSPARSE ライブラリの単精度,倍精度 ILU(0) 前処理を適用した場合についても検討を行った.本稿では The University of Florida Sparse Matrix Collection から収集した疎行列において 4 倍精度演算を用いることで求解を高速化できた 4 つのケースを示し,反復回数を削減し求解を高速化する手段として,倍精度演算の代わりに 4 倍精度演算を用いる有効性について検討を行う.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1572824502742031744
  • NII論文ID
    110009588155
  • NII書誌ID
    AN10463942
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ