組込み向けGPUを用いた畳み込み演算の高速化に関する検討
Search this article
Description
深層学習のモデルの1つである畳み込みニューラルネットワーク(CNN)は、物体検出、物体認識、音声認識など多様な応用において有望な手法であり、組込みにおいても需要がある。CNNは畳み込み演算のために計算量が非常に大きいため、リアルタイム処理を実現するためにGPU活用が検討されており、様々な深層学習向けOSSを用いることでGPU利用による高速化が可能である。しかしながら、OSSを用いる場合、実装先GPUに制限があることや、実装コードの品質保証が難しいことが問題となる。そこで、本発表では、組込み向けGPUに対して畳み込み演算のフルスクラッチ実装を行い、高速化を検討する。
Journal
-
- 第82回全国大会講演論文集
-
第82回全国大会講演論文集 2020 (1), 3-4, 2020-02-20
情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050574047105976192
-
- NII Article ID
- 170000182031
-
- NII Book ID
- AN00349328
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles