階層型粗粒度並列処理における同一階層内ループ間データローカライゼーション手法

書誌事項

タイトル別名
  • カイソウガタソリュウド ヘイレツ ショリ ニ オケル ドウイツ カイソウ ナイ ループ カン データローカライゼーション シュホウ
  • A Data - localization Scheme among Loops for Each Layer in Hierarchical Coarse Grain Parallel Processing
  • 並列化コンパイラ

この論文をさがす

抄録

本論文では 階層的に粗粒度並列処理を行う階層型マクロデータフロー処理におけるデータローカライゼーション手法を提案する. 本手法では 階層型ループ整合分割法を用いて各階層の処理とデータを分割し パーシャルスタティックタスク割当てを用いた階層型ダイナミックスケジューリング方式により 各階層において相互間に多量のデータ転送が生じる可能性がある粗粒度タスクの集合を当該階層の同一プロセッサクラスタに割り当て さらに各プロセッサ上のローカルメモリを有効利用してデータ転送オーバヘッドを軽減する. マルチプロセッサシステムOSCAR上で行った性能評価の結果 本データローカライゼーション手法を用いた階層型マクロデータフロー処理では データローカライゼーションを用いない場合に比べて処理時間が10?20%短縮されることが確かめられた.

This paper proposes a data-localization scheme for hierarchical macro-dataflow processing, which hierachically exploits coarse-grain parallelism. The proposed data-localization scheme consists of three parts: (1) hierarchical loop aligned decomposition, which decomposes multiple loops having data dependences into data-localization-groups in each layer; (2) generation of hierarchical dynamic sheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor-cluster in each layer; (3) generation of data transfer code via local memory inside data-localization-group. Performance evaluation on a multiprocessor system OSCAR shows that hierarchical macro-dataflow processing with data-localization can reduce execution time by 10-20% compared with hierarchical macro-dataflow processing without data-localization.

収録刊行物

被引用文献 (30)*注記

もっと見る

参考文献 (18)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ