部分観測下での最悪ケースに基づくスーパバイザの強化学習

書誌事項

タイトル別名
  • ブブン カンソク カ デ ノ サイアク ケース ニ モトズク スーパバイザ ノ キョウカ ガクシュウ
  • Reinforcement learning of the supervisor based on the worst-case behavior under partial observation

この論文をさがす

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (11)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ