オンラインEMアルゴリズムを用いた強化学習法

石井 信, 佐藤 雅昭

書誌事項

タイトル別名

Reinforcement learning using on-line EM algorithm

説明

Actor-Criticモデルに基づく新しい強化学習の手法を提案する。ActorとCriticはいずれも正規化ガウス関数ネットワークによって近似され、先に提案したオンラインEMアルゴリズムを用いて学習を行なう。新しい強化学習の手法を単振子の振り上げ・倒立のタスクと、二重振子を頂点付近で倒立させるタスクに応用した。結果として、本手法が連続な状態空間と連続な制御信号空間を持つような最適制御問題に応用できることが示された。

収録刊行物

電子情報通信学会技術研究報告. NC, ニューロコンピューティング

電子情報通信学会技術研究報告. NC, ニューロコンピューティング 98 (577), 41-48, 1999-02-05

一般社団法人電子情報通信学会

キーワード

詳細情報詳細情報について

CRID: 1570291227540510080

NII論文ID: 110003233550

NII書誌ID: AN10091178

本文言語コード: ja

データソース種別

CiNii Articles

書き出し

問題の指摘

オンラインEMアルゴリズムを用いた強化学習法

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (2)*注記

参考文献 (13)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

オンラインEMアルゴリズムを用いた強化学習法

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (2)*注記

参考文献 (13)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について