Profit Sharing に基づく強化学習の理論と応用 (<特集>計算学習理論の進展と応用可能性)

宮崎 和光, 木村 元, 小林 重信

doi:10.11517/jjsai.14.5_800

書誌事項

タイトル別名

Theory and Applications of Reinforcement Learning Based on Profit Sharing (<Special Issue>"Recent Dvelopments in the Theory and Applications of Machine Learning")
Profit Sharingに基づく強化学習の理論と応用
Profit Sharing ニモトヅクキョウカガクシュウノリロントオウヨウ

この論文をさがす

説明

<p>1・1 工学の視点からみた強化学習強化学習とは, 報酬という特別な人力を手がかりに環境に適応した行動決定戦略を追求する機械学習システムである. 強化学習の重要な特徴に, 1)報酬駆動型学習であること, 2)環境に対する先見的知識を前提としないこと, の2点がある. このことは, 「何をして欲しいか(what)」という目標を報酬に反映させるだけで, 「その実現方法(how to)」を学習システムに獲得させることを意味する. 強化学習システムは, 人間が考えた以上の解を発見する可能性がある. 加えて, 環境の一部が予め既知な場合には, 知識を組み込むことも可能である. この場合, 知識ベースが不完全であってもあるいは多少の誤りが含まれていても構わない. また, 強化学習は, ニューロやファジィなどの既存の手法との親和性が高い. さらに, 緩やかな環境変化には追従可能である. これらの理由から, 強化学習は工学的応用の観点から非常に魅力的な枠組と言える.</p>

収録刊行物

人工知能

人工知能 14 (5), 800-807, 1999-09-01

一般社団法人人工知能学会

キーワード

詳細情報詳細情報について

CRID: 1390848647555953664

NII論文ID: 110002808748

NII書誌ID: AN10067140

ISSN: 09128085; 24358614; 21882266

DOI: 10.11517/jjsai.14.5_800

NDL書誌ID: 4841475

Web Site: http://id.ndl.go.jp/bib/4841475; https://ndlsearch.ndl.go.jp/books/R000000004-I4841475

本文言語コード: ja

データソース種別

JaLC
NDLサーチ
CiNii Articles

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘

Profit Sharing に基づく強化学習の理論と応用 (<特集>計算学習理論の進展と応用可能性)

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (41)*注記

参考文献 (27)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

Profit Sharing に基づく強化学習の理論と応用 (<特集>計算学習理論の進展と応用可能性)

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (41)*注記

参考文献 (27)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について