Many Integrated Core architectureにおける倍々精度疎行列ベクトル積

この論文をさがす

説明

MIC(Many Integrated Core Architecture) のようなメモリ性能に対して演算器性能が十分に高いアーキテクチャではその演算能力を高精度演算に割くことが可能である.高精度演算は演算時間が長いため,倍々精度と呼ばれる倍精度変数 2 つを組み合わせて 1 つの四倍精度変数の値を保持する高速な演算手法がある.本研究では,MIC 向けに SIMD を用いて倍精度疎行列と倍々精度ベクトルの積を実装し,疎行列の格納形式の違いから性能決定の要因を検証した.疎行列の格納形式である CRS 形式と BCRS 形式を対比させながらメモリアクセスや計算量,列あたりの平均ブロックヒット数,並列化時の AFFINITY と SCHEDULE について検証し,条件の良い問題では BCRS 形式は CRS 形式に対して 17 倍の性能を示した.特にブロックヒット数が性能を決める大きな要因であり,ブロックヒット数が 1.9 以上の時は BCRS 形式,1.9 未満の時は CRS 形式を用いることで多くの疎行列にて高い性能を示すことを明らかにした.

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1571980077781098624
  • NII論文ID
    110009808111
  • NII書誌ID
    AN10463942
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ