マルチインスタンスGPUを用いた推論ワークロードのクラスタスケジューリング

この論文をさがす

抄録

NVIDIA マルチインスタンスGPU(MIG)は,2020年にNVIDIAによって発表されたGPUの新たな分割機構である.この技術は従来のMulti Process ServiceやvGPUと異なり,障害分離性を保ったまま複数のジョブを同一GPU内で同時に実行でき,1つのジョブあたり1つのGPUを使用する場合より,コストを削減することが可能である.本研究では,荷物の組み合わせを考慮したビンパッキング問題に還元することにより,使用するGPU数を最小化するスケジューラを作成した.シミュレーションを行い,インスタンスの分割を固定した場合と比較した.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ