探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案

書誌事項

タイトル別名
  • Parallel Reinforcement Learning Systems Using Exploration Agents
  • タンサク エージェント オ ドウニュウシタ ガクシュウ ケイケン オ キョウユウスル マルチエージェント キョウカ ガクシュウ システム ノ テイアン

この論文をさがす

抄録

We propose a new strategy for parallel reinforcement learning ; using this strategy, the optimal value function and policy can be constructed more quickly than by using traditional strategies. We define two types of agents : the exploitation agents and the exploration agents. The exploitation agents select actions mainly for exploitation, and the exploration agents concentrate on exploration using the extended k-certainty exploration method. These agents learn in the same environment in parallel and combine each value function periodically. By using this strategy, the construction of the optimal value function is expected, and the optimal actions can be selected by the exploitation agents quickly. The experimental results of the mobile robot simulation showed the availability of our method.

収録刊行物

参考文献 (11)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ