Social Reinforcement Learning in Heterogeneous Agents

DOI

抄録

本発表では,線形計画法を用いたリファレンスガバナはマルチパラメトリック線形計画問題に帰着できることを示し,それを利用した方法を提案する.マルチパラメトリック線形計画問題を解くことにより,最適解はパラメータの区分的アフィン関数で表現できる.これによりオンライン計算量が軽減されることが期待される.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390001205645696768
  • NII論文ID
    130007001732
  • DOI
    10.11511/jacc.46.0.917.0
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ