畳み込みニューラルネットワークを用いた過去の履歴を考慮した強化学習

Search this article

Abstract

Deep Learning とQ Learningを組み合わせた手法を用いて学習を行うDeep Q-Networkが提案されている。Deep Q-Network は複数のアーケードゲームに対してそれぞれのゲームのための調整をせずに適用され、ゲームによっては人間よりも高いスコアを獲得している。しかし、4 時刻分の画面のデータを入力としているので、過去の履歴を考慮して行動を決定しなければならないゲームは苦手であるという問題がある。本研究では、Deep Q-Networkへの入力として過去の履歴も含めたパターンを利用することにより、過去の履歴などを考慮する方法について検討を行う。

Journal

Details 詳細情報について

Report a problem

Back to top