不完全情報ゲームにおける環境モデルの潜在的学習によるゲーム木探索

迫田 真太郎, 大渡 勝己, 田中 一樹, 甲野 佑

doi:10.11517/pjsai.jsai2020.0_2j5gs205

書誌事項

タイトル別名

Mastering a Game with Imperfect Information by Game Tree Search with a Latently Learned Model
In the Case of "Gyakuten Othellonia"
逆転オセロニアの場合

説明

<p> ボードゲーム AI の分野において、ニューラルネットワークによる盤面評価と木探索を組み合わせる手法が注目を集めている。木探索を行うためには盤面の遷移則が既知である必要があるが、モデルベース強化学習と関連して盤面の遷移則を学習する研究も活発に進められており、中でも MuZero は Atari・囲碁・将棋・チェスといったゲームにおいて高い性能を示している。本研究では MuZero のアルゴリズムを教師あり学習として再定義し、より複雑なゲームである「逆転オセロニア」へ適用する手法について検討する。「逆転オセロニア」は不完全情報性や不確定性を持つゲームであるため、多面的な情報を複数ターンに渡って保持できるような遷移を学習する必要がある。MuZeroアルゴリズムを直接「逆転オセロニア」へ適用した場合、部分的に性能は向上するが、遷移の不確かさにより木探索に悪影響が出る場合もあることが確認された。分析から、遷移の不確かさを考慮した木探索を行うことでさらなる性能向上が見込める可能性が示唆された。 </p>

収録刊行物

人工知能学会全国大会論文集

人工知能学会全国大会論文集 JSAI2020 (0), 2J5GS205-2J5GS205, 2020

一般社団法人人工知能学会

キーワード

詳細情報詳細情報について

CRID: 1390566775142849152

NII論文ID: 130007856988

DOI: 10.11517/pjsai.jsai2020.0_2j5gs205

ISSN: 27587347

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘