高精度総和計算と高精度内積計算のGPUのための並列アルゴリズム

書誌事項

タイトル別名
  • コウセイド ソウワ ケイサン ト コウセイド ナイ セキ ケイサン ノ GPU ノ タメ ノ ヘイレツ アルゴリズム
  • Parallel Algorithms for Accurate Summation and Dot Product on the GPU

この論文をさがす

抄録

浮動小数点数の加算と乗算の無誤差変換に基づく高精度総和計算と高精度内積計算アルゴリズムが荻田らによって開発された.これらのアルゴリズムは,通常精度の K 倍 (K ≥ 2) の精度で計算されたベクトルの総和または内積の計算結果を通常精度に丸めたものと同等の精度を持っていることが示されている.ベクトルの内積計算は数値線形代数の基本演算であるから,大規模な問題を高精度で計算することが求められることが多い.しかし,高精度総和,高精度内積計算は提案された形式のままでは逐次性が強いアルゴリズムである.これらのアルゴリズムを GPU 上で効率的に実行するために,総和に対する parallel reduction 演算に基づいた並列アルゴリズムを開発した.

Accurate summation and dot product algorithms of floating point numbers using error-free transformations were proposed by Ogita et al. The accuracy of its computational results is comparable to a K-fold working precision, where K ≥ 2. Since the dot product is an elementary operation in numerical linear algebra, highly accurate computations for large arrays are frequently required in many applications. However, accurate summation and dot product algorithms seem inherently sequential. To execute the accurate dot product (and summation) efficiently on the GPU, we develop an efficient data parallel algorithm by applying the parallel reduction operation.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ