マルチグレイン並列性向上のための選択的インライン展開手法

書誌事項

タイトル別名
  • マルチグレイン ヘイレツセイ コウジョウ ノ タメ ノ センタクテキ インライン テンカイ シュホウ
  • Selective Inline Expansion for Improvement of Multi Grain Parallelism
  • 並列・分散処理技術

この論文をさがす

抄録

マルチプロセッサシステムの利用範囲拡大とともに実質実行性能(実効性能)・ソフトウェア生産性・価格性能比の向上のため,自動並列化コンパイラの必要性が高まっている.特にコンパイラによる実効性能を高めるため,基本ブロック,ループ,サブルーチン間の粗粒度並列処理・ループイタレーション間の中粒度並列処理・基本ブロック内ステートメント間の近細粒度並列処理を階層的に組み合わせ,プログラム全域の並列性を利用するマルチグレイン並列処理が重要となっている.マルチグレイン並列処理において階層的に並列性を抽出し,効率良い並列実行を実現するためには,各階層(ネストレベル)の並列性に応じ,適切なプロセッサ数を配分する必要がある.またこの際,階層の異なる,すなわちネストされたサブルーチンをインライン展開により同一階層になるようリストラクチャリングすることで,粗粒度並列性を高めることが可能となるため,これも考慮し適切なプロセッサ配分を行う必要がある.本稿ではプログラム中の各階層の並列度を用いマルチグレイン並列性を高めるためにインライン展開すべきサブルーチンを選択する手法と,それを考慮したプロセッサ配分法を提案する.本手法の性能をIBM RS6000 PowerPC 604e High Node 8 プロセッサミッドレンジSMPサーバ上,および1.1 GHz のPower4 を搭載した16 way ハイエンドSMP サーバIBM pSeries690regattaH 上で,SPEC95FP ベンチマークのうち,並列性の高いサブルーチンが異なる階層(ネストレベル)に分散しているプログラムである103.su2cor ,107.mgrid ,125.turb3d を用いて評価を行った.逐次処理に対してRS6000 上で2.84 ?6.04 倍,regattaH 上で3.54 ?11.19 倍,またインライン展開を併用しない従来のプロセッサ配分手法に対してRS6000 上で1.12 ?1.79 倍,regattaH上で1.03 ?1.47 倍の高速化が可能になることが確かめられた.

With the increase of applications of multiprocessor systems,needs of automatic parallelizing compilers are increasing to improve effective performance, cost performance,and software productivity. Especially,for higher effective performance by compiler, a multi-grain parallel processing which exploits coarse grain parallelism among loops, subroutines and basic blocks, medium grain parallelism among loop-iterations and near fine grain parallelism among statements inside a basic block,is getting important. In multi-grain parallel processing, it is required to assign the appropriate number of processors to each nested layer, considering the parallelism of each layer. At that time,inline expansion of subroutines having large parallelism in a lower layer can increase coarse grain parallelism significantly. Therefore,considering this program restructuring,a compiler must assign processors to each layer. To this end,this paper proposes a selective inline expansion scheme for improvement of multi grain parallelism. Effectiveness of the proposed scheme is evaluated on IBM RS6000, midrange SMP server with 8 processors and IBM pSeries690 regattaH,highend SMP server with 16 processors, using 103.su2cor,107. mgrid, 125.turb3d of SPEC95FP. The multi grain parallel processing using the proposed scheme gave us 2.84 to 6.04 times speedup on RS6000, 3.54 to 11.19 times speedup on regattaH against sequential processing, 1.12 to 1.79 times speedup on RS6000, 1.03 to 1.47 times speedup on regattaH against conventional multi-grain parallelization.

収録刊行物

被引用文献 (4)*注記

もっと見る

参考文献 (12)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ