ニューラルネットワークを用いた強化学習における環境状態の分布を考慮した擬似リハーサルの導入
この論文をさがす
説明
近年,ニューラルネットワーク(NN)を用いた強化学習が強化学習研究の主流となっている.中でもDirect-Vision-Based強化学習やNeural Fitted Q network,深層NNを用いたDeep Q Networkなどの手法の登場により,強化学習の性能向上が確認されている.しかし,強化学習はその試行錯誤的な学習方法から,最適な方策を獲得するまでに多くの学習回数を要する.それに加えNN特有の問題が存在し,学習効率の悪化が起こっていると考えられている.この問題を解決するためにMarochkoらは擬似リハーサルと呼ばれる手法を強化学習に導入してその有効性を示した.本研究では学習効率の更なる向上を期待し,擬似リハーサルにおける擬似入力生成方法の改良を行い,計算機実験によってその有効性を検証した.
収録刊行物
-
- 第80回全国大会講演論文集
-
第80回全国大会講演論文集 2018 (1), 103-104, 2018-03-13
情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050292572129781120
-
- NII論文ID
- 170000177060
-
- NII書誌ID
- AN00349328
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles