Social Reinforcement Learning in Heterogeneous Agents

DOI

Abstract

本発表では,線形計画法を用いたリファレンスガバナはマルチパラメトリック線形計画問題に帰着できることを示し,それを利用した方法を提案する.マルチパラメトリック線形計画問題を解くことにより,最適解はパラメータの区分的アフィン関数で表現できる.これによりオンライン計算量が軽減されることが期待される.

Journal

Details 詳細情報について

  • CRID
    1390001205645696768
  • NII Article ID
    130007001732
  • DOI
    10.11511/jacc.46.0.917.0
  • Data Source
    • JaLC
    • CiNii Articles
  • Abstract License Flag
    Disallowed

Report a problem

Back to top