GPU向けQCDライブラリQUDAのTCAアーキテクチャ実装の性能評価
この論文をさがす
説明
近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信を CPU に接続されたネットワークインターフェースを介して行う必要があるため,複数回のメモリコピー等によるオーバヘッドが発生してしまう.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.この問題に対する解決として,我々は GPU 間通信のレイテンシの改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.2013 年 10 月には TCA 実証システムである HA-PACS/TCA クラスタが筑波大学計算科学研究センターに導入された.本稿では,素粒子物理学のための GPU 向け格子量子色力学 (格子 QCD) ライブラリである "QUDA" に対し,TCA を適用した実装の性能評価を行う.
収録刊行物
-
- 情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
-
情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2014 (43), 1-9, 2014-07-21
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1573668927641355904
-
- NII論文ID
- 110009808138
-
- NII書誌ID
- AN10463942
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles