マルチコアPCクラスタ向けAll-to-all通信アルゴリズムの提案と評価

書誌事項

タイトル別名
  • マルチコア PC クラスタ ムケ All-to-all ツウシン アルゴリズム ノ テイアン ト ヒョウカ
  • A Proposal and Evaluation of All-to-all Algorithm for Multi-core PC Cluster Systems

この論文をさがす

抄録

本稿では,マルチコアPCクラスタ上でのAll-to-all通信性能の最適化について述べる.既存のAll-to-all通信アルゴリズム(Ringアルゴリズム)を使用してマルチコアPCクラスタでAll-to-all通信を行うと,シングルコア使用時と比較して実効通信バンド幅が低下する.All-to-all通信中の詳細な挙動調査を実施した結果,その原因がネットワークスイッチ内で発生するHead-of-line(HoL)ブロッキングであることが明らかとなった.このHoLブロッキング発生を回避する2-Level Ringアルゴリズムを提案する.24台のIAサーバを1台のInfinBandスイッチで接続したマルチコアPCクラスタ上で性能を評価した結果,2-Level RingアルゴリズムでAll-to-all通信中の実効通信バンド幅は最大24%向上することが分かった.さらに,NPB FTとISの処理性能は最大7%向上することを確認した.

In order to realize high network bandwidth during all-to-all communication on multi-core PC cluster system, an existing all-to-all algorithm (ring algorithm) is not optimum, even inadequate. According to our study, it is highly possible that using ring algorithm on multi-core PC cluster system causes Head-of-line (HoL) blocking in network switch. We propose 2-level ring algorithm that can reduce the chance of HoL blocking significantly. The experimental results show that 2-level ring algorithm realizes higher network bandwidth compared to ring algorithm by 24% at maximum and improves the performance of NPB FT and IS by 7% at maximum.

収録刊行物

被引用文献 (1)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ