AI最前線(第40回)安全が保証された強化学習 リアプノフ関数で制約満たす方策を導出

書誌事項

タイトル別名
  • AI サイゼンセン(ダイ40カイ)アンゼン ガ ホショウ サレタ キョウカ ガクシュウ リアプノフ カンスウ デ セイヤク ミタス ホウサク オ ドウシュツ

この論文をさがす

抄録

であり、〓は〓から開始して各状態に到達する確率の総和を表す。よって、右辺は各状態に到達する確率の総和それぞれに補助制約コストを掛けたものの総和となる。この総和が補助制約コストに設定可能な残りより小さくなることを要請する。

収録刊行物

  • Nikkei robotics

    Nikkei robotics (40), 36-38, 2018-11

    東京 : 日経BP社

詳細情報

問題の指摘

ページトップへ