AI最前線(第40回)安全が保証された強化学習 リアプノフ関数で制約満たす方策を導出

Bibliographic Information

Other Title
  • AI サイゼンセン(ダイ40カイ)アンゼン ガ ホショウ サレタ キョウカ ガクシュウ リアプノフ カンスウ デ セイヤク ミタス ホウサク オ ドウシュツ

Search this article

Abstract

であり、〓は〓から開始して各状態に到達する確率の総和を表す。よって、右辺は各状態に到達する確率の総和それぞれに補助制約コストを掛けたものの総和となる。この総和が補助制約コストに設定可能な残りより小さくなることを要請する。

Journal

  • Nikkei robotics

    Nikkei robotics (40), 36-38, 2018-11

    東京 : 日経BP社

Details 詳細情報について

Report a problem

Back to top