クールノー競争におけるマルチエージェント強化学習に関する研究
この論文をさがす
説明
本研究では,不完全観測下のクールノー競争におけるマルチエージェント強化学習のダイナミクスを分析した.クールノー競争とは,複占市場で同じ商品の供給量を決めるゲームで,囚人のジレンマの一般化の1つとして知られている.一般に,プレイヤがお互いの行動を見間違う不完全観測下の均衡計算は非常に小規模な問題にしか適応できない.そこで,本研究では複数の強化学習アルゴリズムを用いてダイナミクスの帰結が厳密に均衡を計算する代わりになるかどうかを検証する.また,強化学習の帰結はしばしば複雑になるため,シンプルなレプリケータダイナミクスの帰結とも比較することで,均衡に相当する振る舞いを明らかにする.
収録刊行物
-
- 第84回全国大会講演論文集
-
第84回全国大会講演論文集 2022 (1), 11-12, 2022-02-17
情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050294020602558848
-
- NII書誌ID
- AN00349328
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB