MPI_Allreduceの「京」上での実装と評価

松本, 幸, 安達, 知也, 住元, 真司, 南里, 豪志, 曽我, 武史, 宇野, 篤也, 黒川, 原佳, 庄司, 文由, 横川, 三津夫

MPI_Allreduceの「京」上での実装と評価

情報処理学会情報処理学会 Web Site

書誌事項

タイトル別名

MPI_Allreduce ノ「キョウ」ウエデノジッソウトヒョウカ
Implementation and Evaluation of MPI_Allreduce on the K Computer

この論文をさがす

抄録

本論文では， 82,944 台の計算ノードを Tofu インターコネクトと呼ばれる 6 次元の直接網で結合した「京」における MPI 集団通信の高速化について述べる．従来の MPI ライブラリには，トポロジを考慮したアルゴリズムが存在しないため，「京」のような直接網において性能を出すことができない．そのため， Trinaryx3 と呼ばれる Allreduce を設計し，「京」向けの MPI ライブラリに実装した． Trinaryx3 アルゴリズムは，トーラス向けに最適化されており，「京」の特長の 1 つである複数 RDMA エンジンを活用することができる．実装を評価した結果，既存のトポロジを考慮していないアルゴリズムと比較して， 5 倍のバンド幅の向上を確認した．

This paper reports a method of speeding up MPI collective communication on the K computer, which consists of 82,944 computing nodes connected by a 6D direct network, named Tofu interconnect. Existing MPI libraries, however, do not have topology-aware algorithms which perform well on such a direct network. Thus, an Allreduce collective algorithm, named Trinaryx3, is designed and implemented in the MPI library for the K computer. The algorithm is optimized for a torus network and enables utilizing multiple RDMA engines, one of the strengths of the K computer. The evaluation results show the new implementation achieves five times higher bandwidth than existing one.

収録刊行物

情報処理学会論文誌コンピューティングシステム（ACS）

情報処理学会論文誌コンピューティングシステム（ACS） 5 (5), 152-162, 2012-10-15

東京 : 情報処理学会

詳細情報詳細情報について

CRID

1050001337901997056
NII論文ID

110009464402
NII書誌ID

AA11833852
ISSN

18827829

18827772

03875806
NDL書誌ID

024421928
Web Site

http://id.nii.ac.jp/1001/00086051/

http://id.nii.ac.jp/1001/00082202/

http://id.ndl.go.jp/bib/024421928

https://ndlsearch.ndl.go.jp/books/R000000004-I024421928
本文言語コード

ja
資料種別

article
データソース種別
- IRDB
- NDL
- CiNii Articles
- KAKEN

書き出し

問題の指摘

ページトップへ

MPI_Allreduceの「京」上での実装と評価

書誌事項

この論文をさがす

抄録

収録刊行物

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

MPI_Allreduceの「京」上での実装と評価

書誌事項

この論文をさがす

抄録

収録刊行物

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について