強化学習におけるファジィ状態空間の動的構築 - 状態のファジィ集合の共有と削除に関する検討 -
書誌事項
- タイトル別名
-
- Reinforcement Learning Based on Dynamic Construction of the Fuzzy State Space - Sharing and Removing Fuzzy Sets of the State
抄録
以前に,実数値環境下のQ-learningにおいて,状態空間を動的に構築していく方法を提案した.これは,状態のないところから必要に応じて状態を追加し,報酬によるQ値の更新を行ないながら,各状態変数のファジィ集合の中心値と幅をTD誤差を用いて調整するというものであった.この方法においては,ルールを追加する際に,各状態のファジィ集合を全て生成していた. その結果,ある状態変数においては,良く似たファジィ集合が生成されてしまっていた.また,状態の削除をしていないので,成功率が高く推移している時でも状態が少しずつ増加していた. そこで,状態の増加を抑えるために不要な状態を削除する方法を提案する.しかし,これだけでは追加と削除が繰り返されるため,成功率が高いときは追加と削除が起こりにくくなるようにパラメータを調整する.さらに,良く似たファジィ集合ができないように,ルール間でファジィ集合を共有した.この方法を実数値環境下における追跡問題に適用した結果,学習後期の状態の増加も抑えることができた.
収録刊行物
-
- 日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
-
日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集 24 (0), 198-198, 2008
日本知能情報ファジィ学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390001205672041344
-
- NII論文ID
- 130005035228
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可