模倣学習と強化学習を原理に沿って連携 UCBとTRIが方策のカスタマイズ技術

Bibliographic Information

Other Title
  • モホウ ガクシュウ ト キョウカ ガクシュウ オ ゲンリ ニ ソッテ レンケイ UCB ト TRI ガ ホウサク ノ カスタマイズ ギジュツ

Search this article

Description

図4(d)の駐車の実験では、模倣学習で基本タスクだけを学ばせたIL-Pよりも、追加タスクを学習したIL-Cの方が成功率が高まる結果が得られた(図5)。これは、模倣学習では基本タスクの性能が十分に高まらない場合に、RQLによるカスタマイズで性能を改善できる可…

Journal

  • Nikkei robotics

    Nikkei robotics (106), 28-33, 2024-05

    東京 : 日経BP社

Details 詳細情報について

Report a problem

Back to top