「一般化塗りつぶし問題」におけるマルチエージェント強化学習

この論文をさがす

抄録

本研究では「一般化塗りつぶし問題」にボトムアップ型のマルチエージェントとトップダウン型指揮官モデルを実装し、合計10Mステップ分の学習をさせ、様々な観点から比較をした。この問題は複数のエージェントで平面全体を塗りつぶすゲームであり、お掃除ロボなど複数のロボットを協調させるアルゴリズムの探究にも利用できる。各エージェントには平面の座標を観測値として渡し、全体を塗り終わると各エージェントに報酬が与えられる。本研究で比較する目的は、平面の形状に応じてマルチエージェントと指揮官モデルのどちらが効率的なアルゴリズムかを判断するためである。複数のドローンに効率的に空間を探索させる手法として役立つ。

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ