不規則型応用を加速するメモリアクセラレータ - Exa FLOPSマシンの文脈から

書誌事項

タイトル別名
  • Memory Accelerator for Irregular Applications - From the Context of Exa FLOPS Machine

この論文をさがす

説明

Byte/FLOP を現在より下げざるを得ない Exa FLOPS 級マシンにおいて,国内では階層キャッシュが重要視されている.一方,不規則型応用は必要な Byte/FLOP が大きく,かつ,文科省の重点指定アプリの中でも大きな比率をしめており,日本の Exa FLOPS 級マシンの文脈において対応が重要である.本報告では Gather 機能を有するメモリシステムについて上記の文脈上で考察する。その判断材料として現状の GPU のキャッシュヒット率と,キャッシュを前段に併用した Gather 機能を有するメモリシステムについて疎行列ベクトル積の性能評価を行なった.その結果,キャッシュによる性能向上は限定的で,その容量の 10 倍程度のベクトルサイズまでで頭打ちとなった.不規則型応用に対して再利用性に高速化原理をおくキャッシュに頼りきることは危険であり,Gather 機構が重要であることが確認された.In Japan, hierarchical cache is currently given high priority for memory system of Exa FLOPS machine whose Byte/FLOP ratio must be smaller than current supercomputers. On the other hand, irregular applications require higher Byte/FLOP ratio. Since these occupy a large part of MEXT-selection of focused applications, supporting irregular applications is important in the context of Japanese Exa FLOPS machine. In this report, a memory system with gather functions is reconsidered in the context of Exa FLOPS machine. We explored hit ratio of a current GPU's cache and performance of memory system with gather function and its preliminary stage cache for sparse matrix vector multiplication. As a result, performance gain by the additional cache is limited and disappeared for vector with about 10times higher size than the cache capacity. It is confirmed that the importance of gather function for irregular applications is higher than that of cache whose acceleration principle is based on reusability.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1571698601972354304
  • NII論文ID
    110008713520
  • NII書誌ID
    AN10463942
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ