Many Integrated Core architectureにおける倍々精度疎行列ベクトル積

Search this article

Description

MIC(Many Integrated Core Architecture) のようなメモリ性能に対して演算器性能が十分に高いアーキテクチャではその演算能力を高精度演算に割くことが可能である.高精度演算は演算時間が長いため,倍々精度と呼ばれる倍精度変数 2 つを組み合わせて 1 つの四倍精度変数の値を保持する高速な演算手法がある.本研究では,MIC 向けに SIMD を用いて倍精度疎行列と倍々精度ベクトルの積を実装し,疎行列の格納形式の違いから性能決定の要因を検証した.疎行列の格納形式である CRS 形式と BCRS 形式を対比させながらメモリアクセスや計算量,列あたりの平均ブロックヒット数,並列化時の AFFINITY と SCHEDULE について検証し,条件の良い問題では BCRS 形式は CRS 形式に対して 17 倍の性能を示した.特にブロックヒット数が性能を決める大きな要因であり,ブロックヒット数が 1.9 以上の時は BCRS 形式,1.9 未満の時は CRS 形式を用いることで多くの疎行列にて高い性能を示すことを明らかにした.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 2014 (16), 1-7, 2014-07-21

    Information Processing Society of Japan (IPSJ)

Keywords

Details 詳細情報について

  • CRID
    1571980077781098624
  • NII Article ID
    110009808111
  • NII Book ID
    AN10463942
  • Text Lang
    ja
  • Data Source
    • CiNii Articles

Report a problem

Back to top