評価値付き入力ベクトルを扱う自己組織化マップを用いたエージェントの学習パラメータに応じた報酬設計手法

堀尾恵一

九州工業大学
森逸平

九州工業大学
古川徹生

九州工業大学

書誌事項

タイトル別名

Reward Design Method Adapting to Agents' Learning Ability based on Self-Organizing Map with Evaluation Value
ヒョウカネツケキニュウリョクベクトルオアツカウジコソシキカマップオモチイタエージェントノガクシュウパラメータニオウジタホウシュウセッケイシュホウ

この論文をさがす

説明

<p>学習パラメータが異なる様々なエージェントに対し，学習パラメータの推定および適切な報酬を設計するために，評価値付き入力ベクトルを取り扱う自己組織化マップを用いる．</p>

収録刊行物

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集 34 (0), 140-143, 2018

日本知能情報ファジィ学会

キーワード

詳細情報詳細情報について

CRID

1390845713038156672
NII論文ID

130007554399
NII書誌ID

AA12165648
ISSN

18820212
DOI

10.14864/fss.34.0_140
NDL書誌ID

029268208
Web Site

http://id.ndl.go.jp/bib/029268208

https://ndlsearch.ndl.go.jp/books/R000000004-I029268208
本文言語コード

ja
データソース種別
- JaLC
- NDLサーチ
- CiNii Articles
抄録ライセンスフラグ
使用不可

書き出し

問題の指摘

ページトップへ