不規則型応用を加速するメモリアクセラレータ - Exa FLOPSマシンの文脈から
書誌事項
- タイトル別名
-
- Memory Accelerator for Irregular Applications - From the Context of Exa FLOPS Machine
この論文をさがす
説明
Byte/FLOP を現在より下げざるを得ない Exa FLOPS 級マシンにおいて,国内では階層キャッシュが重要視されている.一方,不規則型応用は必要な Byte/FLOP が大きく,かつ,文科省の重点指定アプリの中でも大きな比率をしめており,日本の Exa FLOPS 級マシンの文脈において対応が重要である.本報告では Gather 機能を有するメモリシステムについて上記の文脈上で考察する。その判断材料として現状の GPU のキャッシュヒット率と,キャッシュを前段に併用した Gather 機能を有するメモリシステムについて疎行列ベクトル積の性能評価を行なった.その結果,キャッシュによる性能向上は限定的で,その容量の 10 倍程度のベクトルサイズまでで頭打ちとなった.不規則型応用に対して再利用性に高速化原理をおくキャッシュに頼りきることは危険であり,Gather 機構が重要であることが確認された.In Japan, hierarchical cache is currently given high priority for memory system of Exa FLOPS machine whose Byte/FLOP ratio must be smaller than current supercomputers. On the other hand, irregular applications require higher Byte/FLOP ratio. Since these occupy a large part of MEXT-selection of focused applications, supporting irregular applications is important in the context of Japanese Exa FLOPS machine. In this report, a memory system with gather functions is reconsidered in the context of Exa FLOPS machine. We explored hit ratio of a current GPU's cache and performance of memory system with gather function and its preliminary stage cache for sparse matrix vector multiplication. As a result, performance gain by the additional cache is limited and disappeared for vector with about 10times higher size than the cache capacity. It is confirmed that the importance of gather function for irregular applications is higher than that of cache whose acceleration principle is based on reusability.
収録刊行物
-
- 研究報告ハイパフォーマンスコンピューティング(HPC)
-
研究報告ハイパフォーマンスコンピューティング(HPC) 2011 (14), 1-8, 2011-11-21
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1571698601972354304
-
- NII論文ID
- 110008713520
-
- NII書誌ID
- AN10463942
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles