強化学習におけるファジィ状態空間の動的構築 - 状態のファジィ集合の共有と削除に関する検討 -

DOI
  • 細谷 優
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 山村 忠義
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 馬野 元秀
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 瀬田 和久
    大阪府立大学 大学院理学系研究科 情報数理科学専攻

書誌事項

タイトル別名
  • Reinforcement Learning Based on Dynamic Construction of the Fuzzy State Space - Sharing and Removing Fuzzy Sets of the State

抄録

以前に,実数値環境下のQ-learningにおいて,状態空間を動的に構築していく方法を提案した.これは,状態のないところから必要に応じて状態を追加し,報酬によるQ値の更新を行ないながら,各状態変数のファジィ集合の中心値と幅をTD誤差を用いて調整するというものであった.この方法においては,ルールを追加する際に,各状態のファジィ集合を全て生成していた.  その結果,ある状態変数においては,良く似たファジィ集合が生成されてしまっていた.また,状態の削除をしていないので,成功率が高く推移している時でも状態が少しずつ増加していた.  そこで,状態の増加を抑えるために不要な状態を削除する方法を提案する.しかし,これだけでは追加と削除が繰り返されるため,成功率が高いときは追加と削除が起こりにくくなるようにパラメータを調整する.さらに,良く似たファジィ集合ができないように,ルール間でファジィ集合を共有した.この方法を実数値環境下における追跡問題に適用した結果,学習後期の状態の増加も抑えることができた.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390001205672041344
  • NII論文ID
    130005035228
  • DOI
    10.14864/fss.24.0.198.0
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ