組込み向けGPUを用いた畳み込み演算の高速化に関する検討

Search this article

Description

深層学習のモデルの1つである畳み込みニューラルネットワーク(CNN)は、物体検出、物体認識、音声認識など多様な応用において有望な手法であり、組込みにおいても需要がある。CNNは畳み込み演算のために計算量が非常に大きいため、リアルタイム処理を実現するためにGPU活用が検討されており、様々な深層学習向けOSSを用いることでGPU利用による高速化が可能である。しかしながら、OSSを用いる場合、実装先GPUに制限があることや、実装コードの品質保証が難しいことが問題となる。そこで、本発表では、組込み向けGPUに対して畳み込み演算のフルスクラッチ実装を行い、高速化を検討する。

Journal

Details 詳細情報について

Report a problem

Back to top