- 【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
- Trial version of CiNii Research Automatic Translation feature is available on CiNii Labs
- Suspension and deletion of data provided by Nikkei BP
- Regarding the recording of “Research Data” and “Evidence Data”
畳み込みニューラルネットワークの行列計算におけるTensorコアを用いた並列処理
Search this article
Description
物体検出のディープラーニングに用いられる畳み込みニューラルネットワーク(CNN)では多くの行列計算が行われており,学習時間を短縮するためには行列計算の高速化が不可欠である.行列計算の高速化には,GPUの活用が広く行われているが,さらなる速度向上を実現するためには,単精度浮動小数点数FP32の代わりに,半精度浮動小数点数FP16を利用して,GPUの演算性能を高めることが挙げられる.加えて,Tensorコアを活用することにより,行列計算の高速化が可能になる.そこで本手法では,FP16およびTensorコアを利用するCUDAプログラムを開発しており,CNNの行列計算部分に適用した. NVIDIA Quadro RTX 6000上で行った性能評価の結果,提案手法の有効性が確認された.
Journal
-
- 第83回全国大会講演論文集
-
第83回全国大会講演論文集 2021 (1), 25-26, 2021-03-04
情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050292572144752128
-
- NII Article ID
- 170000187430
-
- NII Book ID
- AN00349328
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles