OSCAR API標準解釈系を用いた階層グルーピング対応ハードウェアバリア同期機構の評価
この論文をさがす
説明
1 チップ内に搭載されるコア数の増加に伴い,アプリケーションからより多くの並列性を抽出し,低オーバーヘッドで利用することがこれらのコアを有効利用するために重要となっている.OSCAR コンパイラによる自動並列化ではより多くの並列性を利用するため,ループやサブルーチン内部の粗粒度並列性を解析し,階層的にタスク定義を行う.この階層的に定義されたタスクをコアを階層的にグルーピングし,コアグループに対して割り当てることにより並列処理を実現する.この階層的なグループ間で独立かつ低コストでバリア同期を実現できるハードウェアが提案され,SH4A プロセッサ 8 コア搭載の情報家電用マルチコア RP2 に実装されている.本稿では,OSCAR API 標準解釈系の階層グループバリア同期 API を RP2 のハードウェアバリア同期機構に対応し評価を行った結果について述べる.8 コアを使用した SPEC CPU 2000 の ART による評価ではソフトウェアでのバリア同期に対し 1.16 倍の性能向上が得られた.
収録刊行物
-
- 情報処理学会研究報告. 計算機アーキテクチャ研究会報告
-
情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2013 (16), 1-6, 2013-07-24
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1573668927672594304
-
- NII論文ID
- 110009587858
-
- NII書誌ID
- AN10096105
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles