状態の調整および状態と行動の組の削除機能を持つ動的ファジィQ-learning

  • 細谷 優
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 馬野 元秀
    大阪府立大学 大学院理学系研究科 情報数理科学専攻

書誌事項

タイトル別名
  • Dynamic Fuzzy Q-Learning with Facilities of Tuning States and Removing Pairs of State and Actions

抄録

近年,離散状態しか取り扱えないQ-learning を拡張し,連続状態を扱えるようにしたファジィ Q-learningに関する研究が行なわれている.また,初期のQ表を与えておき,新しい状態と行動の組を動的に追加していくDynamic Fuzzy Q-Learning (DFQL) も提案されている.我々は,状態のファジィ集合の調整と状態と行動の組の削除機能を持つ,より動的で柔軟なファジィQ-learningを提案する.提案法では,Q値の学習を行ないながら状態の評価値であるV値のTD誤差を用いて状態のファジィ集合の中心値と幅の調整を行なう.そして,ファジィ集合とV値に忘却学習を適用することで不要なファジィ集合と不要な状態と行動の組を削除する.この方法を実数値環境下の追跡問題に適用する.

収録刊行物

  • 知能と情報

    知能と情報 26 (5), 844-854, 2014

    日本知能情報ファジィ学会

被引用文献 (1)*注記

もっと見る

参考文献 (9)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1390282680163908352
  • NII論文ID
    130004705732
  • DOI
    10.3156/jsoft.26.844
  • ISSN
    18817203
    13477986
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • Crossref
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ