オンラインEMアルゴリズムを用いた強化学習法

書誌事項

タイトル別名
  • Reinforcement learning using on-line EM algorithm

この論文をさがす

説明

Actor-Criticモデルに基づく新しい強化学習の手法を提案する。ActorとCriticはいずれも正規化ガウス関数ネットワークによって近似され、先に提案したオンラインEMアルゴリズムを用いて学習を行なう。新しい強化学習の手法を単振子の振り上げ・倒立のタスクと、二重振子を頂点付近で倒立させるタスクに応用した。結果として、本手法が連続な状態空間と連続な制御信号空間を持つような最適制御問題に応用できることが示された。

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (13)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570291227540510080
  • NII論文ID
    110003233550
  • NII書誌ID
    AN10091178
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ