マルチコア超並列環境におけるFFTの自動チューニング(<特集>数値計算のための自動チューニング(続))

書誌事項

タイトル別名
  • Automatic Tuning for Parallel FFTs on Massively Parallel Platforms with Multi-Core Processors(<Special Topics>Auto-Tuning for Numerical Computations (continued))
  • マルチコア超並列環境におけるFFTの自動チューニング
  • マルチコア チョウヘイレツ カンキョウ ニ オケル FFT ノ ジドウ チューニング

この論文をさがす

抄録

This paper presents an automatic performance tuning for parallel fast Fourier transforms (FFTs) on massively parallel platforms with multi-core processors. A blocking algorithm for parallel FFTs utilizes cache memory effectively. Since the optimal block size may depend on the problem size, we propose a method to determine the optimal block size that minimizes the number of cache misses. In addition, parallel FFTs require intensive all-to-all communication, which affects the performance of FFTs. An automatic tuning of all-to-all communication is also implemented. The performance results demonstrate that the proposed implementation of parallel FFTs with automatic performance tuning is efficient for improving the performance.

収録刊行物

  • 応用数理

    応用数理 20 (4), 279-286, 2010

    一般社団法人 日本応用数理学会

参考文献 (15)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ