評価値付き入力ベクトルを扱う自己組織化マップを用いたエージェントの学習パラメータに応じた報酬設計手法

書誌事項

タイトル別名
  • Reward Design Method Adapting to Agents' Learning Ability based on Self-Organizing Map with Evaluation Value
  • ヒョウカ ネツケキ ニュウリョク ベクトル オ アツカウ ジコ ソシキカ マップ オ モチイタ エージェント ノ ガクシュウ パラメータ ニ オウジタ ホウシュウ セッケイ シュホウ

この論文をさがす

説明

<p>学習パラメータが異なる様々なエージェントに対し,学習パラメータの推定および適切な報酬を設計するために,評価値付き入力ベクトルを取り扱う自己組織化マップを用いる.</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ