モンテカルロ版 RGoal アルゴリズムの改良

一杉 裕志, 中田 秀基, 高橋 直人, 竹内 泉, 佐野崇

doi:10.11517/jsaisigtwo.2023.agi-026_50

書誌事項

タイトル別名

Improvements to the Monte Carlo version of RGoal algorithm

抄録

<p>我々は以前再帰的なサブルーチン呼び出しが可能な階層型強化学習アルゴリズム RGoal を提案した。本稿では RGoal のモンテカルロ版アルゴリズムにおける相対価値の基準値の定義を見直し、異なるタスクでサブルーチンが共有される場合の学習の安定化を図る。実装したアルゴリズムはいくつかのテストプログラムで動作を確認した。</p>

収録刊行物

人工知能学会第二種研究会資料

人工知能学会第二種研究会資料 2023 (AGI-026), 50-55, 2024-03-08

一般社団法人人工知能学会

詳細情報詳細情報について

CRID: 1390299395584398720

DOI: 10.11517/jsaisigtwo.2023.agi-026_50

ISSN: 24365556

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用可

モンテカルロ版 RGoal アルゴリズムの改良

書誌事項

抄録

収録刊行物

詳細情報詳細情報について

書き出し

問題の指摘

モンテカルロ版 RGoal アルゴリズムの改良

書誌事項

抄録

収録刊行物

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について