Theory and Applications of Reinforcement Learning Based on Profit Sharing (<Special Issue>"Recent Dvelopments in the Theory and Applications of Machine Learning")
-
- MIYAZAKI Kazuteru
- Graduate School of Interdisciplinary Science and Engineering, Tokyo Institute of Technology
-
- KIMURA Hajime
- Graduate School of Interdisciplinary Science and Engineering, Tokyo Institute of Technology
-
- KOBAYASHI Shigenobu
- Graduate School of Interdisciplinary Science and Engineering, Tokyo Institute of Technology
Bibliographic Information
- Other Title
-
- Profit Sharing に基づく強化学習の理論と応用 (<特集>計算学習理論の進展と応用可能性)
- Profit Sharingに基づく強化学習の理論と応用
- Profit Sharing ニ モトヅク キョウカ ガクシュウ ノ リロン ト オウヨウ
Search this article
Description
<p>1・1 工学の視点からみた強化学習 強化学習とは, 報酬という特別な人力を手がかりに環境に適応した行動決定戦略を追求する機械学習システムである. 強化学習の重要な特徴に, 1)報酬駆動型学習であること, 2)環境に対する先見的知識を前提としないこと, の2点がある. このことは, 「何をして欲しいか(what)」という目標を報酬に反映させるだけで, 「その実現方法(how to)」を学習システムに獲得させることを意味する. 強化学習システムは, 人間が考えた以上の解を発見する可能性がある. 加えて, 環境の一部が予め既知な場合には, 知識を組み込むことも可能である. この場合, 知識ベースが不完全であってもあるいは多少の誤りが含まれていても構わない. また, 強化学習は, ニューロやファジィなどの既存の手法との親和性が高い. さらに, 緩やかな環境変化には追従可能である. これらの理由から, 強化学習は工学的応用の観点から非常に魅力的な枠組と言える.</p>
Journal
-
- Journal of the Japanese Society for Artificial Intelligence
-
Journal of the Japanese Society for Artificial Intelligence 14 (5), 800-807, 1999-09-01
The Japanese Society for Artificial Intelligence
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1390848647555953664
-
- NII Article ID
- 110002808748
-
- NII Book ID
- AN10067140
-
- ISSN
- 09128085
- 24358614
- 21882266
-
- NDL BIB ID
- 4841475
-
- Text Lang
- ja
-
- Data Source
-
- JaLC
- NDL Search
- CiNii Articles
-
- Abstract License Flag
- Disallowed