探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案

舘山 武史, 川田 誠一, 下村 芳樹

doi:10.1299/kikaic.74.692

探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案

DOI 機関リポジトリ HANDLE Web Site Web Site 参考文献11件

舘山武史

首都大学東京システムデザイン学部
川田誠一

産業技術大学院大学情報アーキテクチャ専攻
下村芳樹

首都大学東京システムデザイン学部

書誌事項

タイトル別名

Parallel Reinforcement Learning Systems Using Exploration Agents
タンサクエージェントオドウニュウシタガクシュウケイケンオキョウユウスルマルチエージェントキョウカガクシュウシステムノテイアン

この論文をさがす

抄録

We propose a new strategy for parallel reinforcement learning ; using this strategy, the optimal value function and policy can be constructed more quickly than by using traditional strategies. We define two types of agents : the exploitation agents and the exploration agents. The exploitation agents select actions mainly for exploitation, and the exploration agents concentrate on exploration using the extended k-certainty exploration method. These agents learn in the same environment in parallel and combine each value function periodically. By using this strategy, the construction of the optimal value function is expected, and the optimal actions can be selected by the exploitation agents quickly. The experimental results of the mobile robot simulation showed the availability of our method.

収録刊行物

日本機械学会論文集Ｃ編

日本機械学会論文集Ｃ編 74 (739), 692-701, 2008

一般社団法人日本機械学会

参考文献 (11)*注記

詳細情報詳細情報について

CRID

1390282681363723776
NII論文ID

130004085098

110006643686
NII書誌ID

AN00187463
DOI

10.1299/kikaic.74.692
ISSN

18848354

03875024
HANDLE

10748/4040
NDL書誌ID

9439418
Web Site

https://tokyo-metro-u.repo.nii.ac.jp/records/3710

http://id.ndl.go.jp/bib/9439418

https://ndlsearch.ndl.go.jp/books/R000000004-I9439418

http://www.jstage.jst.go.jp/article/kikaic1979/74/739/74_739_692/_pdf
本文言語コード

ja
データソース種別
- JaLC
- IRDB
- NDL
- Crossref
- CiNii Articles
抄録ライセンスフラグ
使用不可

書き出し

問題の指摘

ページトップへ

探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案

書誌事項

この論文をさがす

抄録

収録刊行物

参考文献 (11)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について