確率的重み付け平均法のラージバッチ学習における有用性の検証

所畑, 貴大, 長沼, 大樹, 横田, 理央

説明

近年の深層ニューラルネットワークモデルの学習には膨大なパラメータやデータを用いるため、学習時間が増加する傾向にあり、学習の高速化が喫緊の課題である。単純に一度に用いるデータ量を増やすことで高速化を図るラージバッチ学習では、スモールバッチ学習でのNoiseの影響が少なくなるため、汎化性能の低いSharpな解への収束へと陥ることが経験的に示されている。本研究では、モデルのパラメータを確率的に平均化する手法であるSWA（Stochastic Weight Averaging）をラージバッチ学習に適用することで、汎化性能劣化問題への改善効果を検証する。

収録刊行物

第82回全国大会講演論文集

第82回全国大会講演論文集 2020 (1), 359-360, 2020-02-20

情報処理学会

詳細情報詳細情報について

CRID: 1050855522047735168

NII論文ID: 170000182367

NII書誌ID: AN00349328

Web Site: https://ipsj.ixsq.nii.ac.jp/records/205298

本文言語コード: ja

資料種別: conference paper

データソース種別

IRDB
CiNii Articles

書き出し

問題の指摘

確率的重み付け平均法のラージバッチ学習における有用性の検証

この論文をさがす

説明

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

確率的重み付け平均法のラージバッチ学習における有用性の検証

この論文をさがす

説明

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について