モデル予測経路積分制御と深層経路コスト予測器による高次元観測モデルベース強化学習

権 裕煥, 鶴峯 義久, 本仲 君子, 三好 誠司, 松原 崇充

doi:10.1299/jsmermd.2019.2a2-c12

書誌事項

タイトル別名

Model-based RL with High Dimensional Observations using MPPI and Deep Path-cost Predictor

抄録

<p>In this paper, we propose a model-based reinforcement learning framework combining Model Predictive Path Integral (MPPI) with a Deep Path-cost Predictor that outputs a state-trajectory cost given an image sequence and a control input sequence as input. We validate the effectiveness of the proposed method by carrying out 2DOF robot arm reaching tasks with multiple targets in simulation.</p>

収録刊行物

ロボティクス・メカトロニクス講演会講演概要集

ロボティクス・メカトロニクス講演会講演概要集 2019 (0), 2A2-C12-, 2019

一般社団法人日本機械学会

キーワード

詳細情報詳細情報について

CRID: 1390846609787451136

NII論文ID: 130007774814

DOI: 10.1299/jsmermd.2019.2a2-c12

ISSN: 24243124

Web Site: https://www.jstage.jst.go.jp/article/jsmermd/2019/0/2019_2A2-C12/_pdf

本文言語コード: ja

データソース種別

JaLC
Crossref
CiNii Articles

抄録ライセンスフラグ: 使用不可

モデル予測経路積分制御と深層経路コスト予測器による高次元観測モデルベース強化学習

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

モデル予測経路積分制御と深層経路コスト予測器による高次元観測モデルベース強化学習

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について