強化学習におけるファジィ状態空間の動的構築 - 状態のファジィ集合の共有と削除に関する検討 -

細谷 優, 山村 忠義, 馬野 元秀, 瀬田 和久

doi:10.14864/fss.24.0.198.0

書誌事項

タイトル別名

Reinforcement Learning Based on Dynamic Construction of the Fuzzy State Space - Sharing and Removing Fuzzy Sets of the State

抄録

以前に，実数値環境下のQ-learningにおいて，状態空間を動的に構築していく方法を提案した．これは，状態のないところから必要に応じて状態を追加し，報酬によるQ値の更新を行ないながら，各状態変数のファジィ集合の中心値と幅をTD誤差を用いて調整するというものであった．この方法においては，ルールを追加する際に，各状態のファジィ集合を全て生成していた．　その結果，ある状態変数においては，良く似たファジィ集合が生成されてしまっていた．また，状態の削除をしていないので，成功率が高く推移している時でも状態が少しずつ増加していた．　そこで，状態の増加を抑えるために不要な状態を削除する方法を提案する．しかし，これだけでは追加と削除が繰り返されるため，成功率が高いときは追加と削除が起こりにくくなるようにパラメータを調整する．さらに，良く似たファジィ集合ができないように，ルール間でファジィ集合を共有した．この方法を実数値環境下における追跡問題に適用した結果，学習後期の状態の増加も抑えることができた．

収録刊行物

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集 24 (0), 198-198, 2008

日本知能情報ファジィ学会

キーワード

詳細情報詳細情報について

CRID: 1390001205672041344

NII論文ID: 130005035228

DOI: 10.14864/fss.24.0.198.0

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

強化学習におけるファジィ状態空間の動的構築 - 状態のファジィ集合の共有と削除に関する検討 -

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

強化学習におけるファジィ状態空間の動的構築 - 状態のファジィ集合の共有と削除に関する検討 -

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について