マルチデバイス・クラウドシステムの実現に向けたCPU用コミュニケーションライブラリの活用

書誌事項

タイトル別名
  • Leveraging an Existing Communication Library for CPU: Toward the Implementation of Multi-device Cloud System

この論文をさがす

抄録

本発表では,マルチデバイス・クラウドシステムの実現に向け,CPU用コミューションライブラリの活用法を提案する.マルチデバイス・クラウドシステムとは,GPUに限らず様々なAIアクセラレータを利用できる分散実行環境を持つクラウドシステムである.マルチデバイス・クラウドシステムを開発するにあたり,異なるデバイス間のコミュニケーションをサポートするライブラリが使用可能になるまでに時間がかかるという問題がある.他のソフトウェアの開発も並行して進むため,実際のクラウド環境でのテストができないといった理由でソフトウェアスタック全体の開発速度を低下させることは避けなければならない.本発表で提案する活用法は,ソフトウェアスタックの開発速度を損ねないための初期段階のコミュニケーションライブラリとして,CPUを経由したコミュニケーション行う.この活用法により,ソフトウェアスタックの開発者は実行環境を利用できる状態で並行開発を行うことができる.

This presentation proposes a software-development approach to leverage an existing communication library used for CPU for a multi-device cloud system that can use different kinds of devices, including GPUs and AI accelerators. Since GPUs and AI accelerators have different characteristics in terms of their design policies, we should take advantage of the two devices. We should keep the development speed of implementing a multi-device cloud system the same because each software stack software is developed in parallel. Our proposed leveraging way is based on an existing communication library and a framework, so it would serve as a first-step way not to stop the entire software stack development.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ