GPU向けQCDライブラリQUDAのTCAアーキテクチャ実装の性能評価

  • 藤井久史
    Graduate School of System and Information Engineering, University of Tsukuba
  • 藤田典久
    Graduate School of System and Information Engineering, University of Tsukuba
  • 塙敏博
    Information Technology Center, The University of Tokyo
  • 児玉祐悦
    Graduate School of System and Information Engineering, University of Tsukuba | Center for Computational Sciences, University of Tsukuba
  • 朴泰祐
    Graduate School of System and Information Engineering, University of Tsukuba | Center for Computational Sciences, University of Tsukuba
  • 佐藤三久
    Graduate School of System and Information Engineering, University of Tsukuba | Center for Computational Sciences, University of Tsukuba
  • 藏増嘉伸
    Center for Computational Sciences, University of Tsukuba
  • MikeClark
    NVIDIA Corporation

Search this article

Description

近年,HPC 分野で GPU などの演算加速装置を用いたクラスタの開発が盛んに行われている.このようなクラスタでは,ノード間をまたぐ演算加速装置間の通信を CPU に接続されたネットワークインターフェースを介して行う必要があるため,複数回のメモリコピー等によるオーバヘッドが発生してしまう.このためレイテンシが増加し,アプリケーションの性能を低下させてしまう.この問題に対する解決として,我々は GPU 間通信のレイテンシの改善を目的とした独自開発の密結合並列演算加速機構 TCA (Tightly Coupled Accelerators) の開発を行なっている.2013 年 10 月には TCA 実証システムである HA-PACS/TCA クラスタが筑波大学計算科学研究センターに導入された.本稿では,素粒子物理学のための GPU 向け格子量子色力学 (格子 QCD) ライブラリである "QUDA" に対し,TCA を適用した実装の性能評価を行う.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 2014 (43), 1-9, 2014-07-21

    Information Processing Society of Japan (IPSJ)

Keywords

Details 詳細情報について

  • CRID
    1573668927641355904
  • NII Article ID
    110009808138
  • NII Book ID
    AN10463942
  • Text Lang
    ja
  • Data Source
    • CiNii Articles

Report a problem

Back to top