Many Integrated Core architectureにおける倍々精度疎行列ベクトル積
この論文をさがす
説明
MIC(Many Integrated Core Architecture) のようなメモリ性能に対して演算器性能が十分に高いアーキテクチャではその演算能力を高精度演算に割くことが可能である.高精度演算は演算時間が長いため,倍々精度と呼ばれる倍精度変数 2 つを組み合わせて 1 つの四倍精度変数の値を保持する高速な演算手法がある.本研究では,MIC 向けに SIMD を用いて倍精度疎行列と倍々精度ベクトルの積を実装し,疎行列の格納形式の違いから性能決定の要因を検証した.疎行列の格納形式である CRS 形式と BCRS 形式を対比させながらメモリアクセスや計算量,列あたりの平均ブロックヒット数,並列化時の AFFINITY と SCHEDULE について検証し,条件の良い問題では BCRS 形式は CRS 形式に対して 17 倍の性能を示した.特にブロックヒット数が性能を決める大きな要因であり,ブロックヒット数が 1.9 以上の時は BCRS 形式,1.9 未満の時は CRS 形式を用いることで多くの疎行列にて高い性能を示すことを明らかにした.
収録刊行物
-
- 情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
-
情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2014 (16), 1-7, 2014-07-21
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1571980077781098624
-
- NII論文ID
- 110009808111
-
- NII書誌ID
- AN10463942
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles