GPU向けQCDライブラリQUDAのTCAアーキテクチャによる実装
この論文をさがす
説明
近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信を CPU メモリを介して行う必要があるため,複数回のメモリコピーが発生してしまう.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.そこで,筑波大学計算科学研究センターでは,GPU 間通信のレイテンシの改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.2013 年 10 月には TCA 実証システムである,HA-PACS/TCA クラスタが導入された.本稿では,素粒子物理学のための GPU 向け格子量子色力学 (格子 QCD) ライブラリである,"QUDA" に対し,TCA を適用した実装について述べる.
収録刊行物
-
- 情報処理学会研究報告. [ハイパフォーマンスコンピューティング]
-
情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2014 (35), 1-7, 2014-02-24
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1571980077765695616
-
- NII論文ID
- 110009675749
-
- NII書誌ID
- AN10463942
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles