「一般化塗りつぶし問題」における強化学習

岩井 大河, 三宅 陽一郎

doi:10.11517/pjsai.jsai2022.0_2o5gs503

<p>本研究では「一般化塗りつぶし問題」にボトムアップ型のマルチエージェント・コミュニケーション・モデル（以下MACモデル）とトップダウン型指揮官AI-エージェントモデル（以下CAIAモデル）に適用した。本問題は複数のエージェントにグリッド状マップ全体を塗りつぶさせるゲームであり、清掃ロボット、地雷除去、ドローン制御など複数のロボットを協調させるアルゴリズムの探究に利用可能である本実験は障害物のないノーマル型と障害物による迷路型を対象とする。各エージェントはニューラルネットワークを持ち、入力には各エージェントの座標とマップ情報を渡し、出力として、MACモデルではエージェント自身が行動を決定し、CAIAモデルでは全エージェントの行動を決定することでマルチエージェント強化学習を行う。全体を塗り終わると各エージェントに報酬を与え学習を進める。本研究の目的は、両モデルを比較し、マップの形状に応じてMACモデルとCAIAモデルのどちらが効率的なアルゴリズムかを判断することにある本研究に応用として複数のドローンに効率的に空間を探索させる手法として役立つ。</p>

「一般化塗りつぶし問題」における強化学習

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

「一般化塗りつぶし問題」における強化学習

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について