GPUを用いた行列-行列積の実装と性能評価

この論文をさがす

抄録

GPUを汎用的な計算に使用するGPGPUが注目されている.この環境でソフトウェアの性能を向上させるには,多数のスレッドによる超並列やコアレスアクセスなどGPUのハードウェア特性を考慮する必要がある.本研究ではNVIDIAのGPU Tesla P100/V100を用いて,基本的な数値計算アルゴリズムの一つである行列-行列積を対象として,Streaming Multiprocessor使用率やShared Memory 使用量などを変化させ,ハードウェア特性を考慮をした実装の性能への影響について評価した.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ