模倣学習と強化学習を原理に沿って連携 UCBとTRIが方策のカスタマイズ技術

書誌事項

タイトル別名
  • モホウ ガクシュウ ト キョウカ ガクシュウ オ ゲンリ ニ ソッテ レンケイ UCB ト TRI ガ ホウサク ノ カスタマイズ ギジュツ

この論文をさがす

説明

図4(d)の駐車の実験では、模倣学習で基本タスクだけを学ばせたIL-Pよりも、追加タスクを学習したIL-Cの方が成功率が高まる結果が得られた(図5)。これは、模倣学習では基本タスクの性能が十分に高まらない場合に、RQLによるカスタマイズで性能を改善できる可…

収録刊行物

  • Nikkei robotics

    Nikkei robotics (106), 28-33, 2024-05

    東京 : 日経BP社

詳細情報 詳細情報について

問題の指摘

ページトップへ