実数値環境の追跡問題におけるファジィ強化学習の比較

DOI
  • 馬野 元秀
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 藤井 康彰
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 細谷 優
    大阪府立大学 大学院理学系研究科 情報数理科学専攻
  • 瀬田 和久
    大阪府立大学 大学院理学系研究科 情報数理科学専攻

書誌事項

タイトル別名
  • Comparison of Fuzzy Reinforcement Learning in Pursuit Problem of Real Number Environment

抄録

マルチエージェントの標準問題に追跡問題がある。これはマス目上で、4つの青エージェントが1つの赤エージェントを追跡して捕獲する問題である。我々はこれを実数値に拡張し、赤エージェントとの距離と方向のファジィ集合を状態とするファジィQ学習を用いて各青エージェントの学習を行ってきた。ファジィQ学習は、行動するごとに一つ前の行動に対して学習を行う方法である。本研究では、一つ前の行動だけでなく、それまでのすべての行動に対して学習を行う方法であるファジィProfitSharing、ファジィQ(λ)、2種類のファジィQ(λ)の拡張手法を実数値環境の追跡問題に適用し、シミュレーションを行い、成功率と成功ターン数を比較した。シミュレーションの結果、ファジィQ(λ)と1種類のファジィQ(λ)の拡張手法が最も良い性能であることがわかった。

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390282680649809792
  • NII論文ID
    130004591775
  • DOI
    10.14864/fss.27.0.18.0
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ