実数値環境の追跡問題におけるファジィ強化学習の比較

馬野 元秀, 藤井 康彰, 細谷 優, 瀬田 和久

doi:10.14864/fss.27.0.18.0

書誌事項

タイトル別名

Comparison of Fuzzy Reinforcement Learning in Pursuit Problem of Real Number Environment

抄録

マルチエージェントの標準問題に追跡問題がある。これはマス目上で、4つの青エージェントが1つの赤エージェントを追跡して捕獲する問題である。我々はこれを実数値に拡張し、赤エージェントとの距離と方向のファジィ集合を状態とするファジィQ学習を用いて各青エージェントの学習を行ってきた。ファジィQ学習は、行動するごとに一つ前の行動に対して学習を行う方法である。本研究では、一つ前の行動だけでなく、それまでのすべての行動に対して学習を行う方法であるファジィProfitSharing、ファジィQ(λ)、2種類のファジィQ(λ)の拡張手法を実数値環境の追跡問題に適用し、シミュレーションを行い、成功率と成功ターン数を比較した。シミュレーションの結果、ファジィQ(λ)と1種類のファジィQ(λ)の拡張手法が最も良い性能であることがわかった。

収録刊行物

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集 27 (0), 18-18, 2011

日本知能情報ファジィ学会

キーワード

詳細情報詳細情報について

CRID: 1390282680649809792

NII論文ID: 130004591775

DOI: 10.14864/fss.27.0.18.0

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

実数値環境の追跡問題におけるファジィ強化学習の比較

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

実数値環境の追跡問題におけるファジィ強化学習の比較

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について