モンテカルロ版 RGoal アルゴリズムの改良

DOI

書誌事項

タイトル別名
  • Improvements to the Monte Carlo version of RGoal algorithm

抄録

<p>我々は以前再帰的なサブルーチン呼び出しが可能な階層型強化学習アルゴリズム RGoal を提案した。本稿では RGoal のモンテカルロ版アルゴリズムにおける相対価値の基準値の定義を見直し、異なるタスクでサブルーチンが共有される場合の学習の安定化を図る。実装したアルゴリズムはいくつかのテストプログラムで動作を確認した。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390299395584398720
  • DOI
    10.11517/jsaisigtwo.2023.agi-026_50
  • ISSN
    24365556
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用可

問題の指摘

ページトップへ