ULIBCライブラリを用いた共有メモリ型並列アルゴリズムの高速化
書誌事項
- タイトル別名
-
- Fast implementation of shared-memory parallel algorithm using ULIBC (Ubiquity Library for Intelligently Binding Cores)
説明
現在,共有メモリ型並列計算機の主要なアーキテクチャとなっている NUMA (Non-Uniform Memory Access) アーキテクチャを有する計算機上には,各プロセッサと対となるローカルメモリと,他のプロセッサと対となるリモートメモリが存在し,各プロセッサコアと各メインメモリ間の距離が異なるためアクセスコストが均一でない.NUMA アーキテクチャ上での高速化にはコストの大きなリモートメモリへのアクセスを削減することが重要になるものの,並列実行時の各スレッドが計算機トポロジ上のどこに配置しているかといった NUMA アーキテクチャを考慮した制御に必要な情報の取得は,既存ライブラリ群だけでは容易ではない.本研究では CPU アフィニティやローカルメモリ確保などの機能をまとめたライブラリ ULIBC (Ubiquity Library for Intelligently Binding Cores) を開発し,いくつかの並列アルゴリズムに対して,ULIBC を用いた NUMA アーキテクチャを考慮した高速化を示す.
Under NUMA (Non-uniform memory access) which is recent major shared memory multi-core architecture, each processor has its own local memory faster than non-local memory. Some speedup techniques which based on reducing access costs to the non-local memory larger than local memory considering NUMA architecture require development cost due to not enough to functions of some libraries for managing of memory access. Therefore, we implemented ULIBC (Ubiquity Library for Intelligently Binding Cores) for CPU affinity and local memory allocation. Finally, we show that some applications achieved performance improvements using ULIBC.
収録刊行物
-
- ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集
-
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 2014 106-115, 2013-12-31
情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050011097177718656
-
- NII論文ID
- 170000079715
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles