書誌事項
- タイトル別名
-
- Parallel Reinforcement Learning Systems Using Exploration Agents
- タンサク エージェント オ ドウニュウシタ ガクシュウ ケイケン オ キョウユウスル マルチエージェント キョウカ ガクシュウ システム ノ テイアン
この論文をさがす
抄録
We propose a new strategy for parallel reinforcement learning ; using this strategy, the optimal value function and policy can be constructed more quickly than by using traditional strategies. We define two types of agents : the exploitation agents and the exploration agents. The exploitation agents select actions mainly for exploitation, and the exploration agents concentrate on exploration using the extended k-certainty exploration method. These agents learn in the same environment in parallel and combine each value function periodically. By using this strategy, the construction of the optimal value function is expected, and the optimal actions can be selected by the exploitation agents quickly. The experimental results of the mobile robot simulation showed the availability of our method.
収録刊行物
-
- 日本機械学会論文集C編
-
日本機械学会論文集C編 74 (739), 692-701, 2008
一般社団法人 日本機械学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390282681363723776
-
- NII論文ID
- 130004085098
- 110006643686
-
- NII書誌ID
- AN00187463
-
- ISSN
- 18848354
- 03875024
-
- HANDLE
- 10748/4040
-
- NDL書誌ID
- 9439418
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- IRDB
- NDL
- Crossref
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可