書誌事項
- タイトル別名
-
- Reinforcement learning using on-line EM algorithm
この論文をさがす
説明
Actor-Criticモデルに基づく新しい強化学習の手法を提案する。ActorとCriticはいずれも正規化ガウス関数ネットワークによって近似され、先に提案したオンラインEMアルゴリズムを用いて学習を行なう。新しい強化学習の手法を単振子の振り上げ・倒立のタスクと、二重振子を頂点付近で倒立させるタスクに応用した。結果として、本手法が連続な状態空間と連続な制御信号空間を持つような最適制御問題に応用できることが示された。
収録刊行物
-
- 電子情報通信学会技術研究報告. NC, ニューロコンピューティング
-
電子情報通信学会技術研究報告. NC, ニューロコンピューティング 98 (577), 41-48, 1999-02-05
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1570291227540510080
-
- NII論文ID
- 110003233550
-
- NII書誌ID
- AN10091178
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles