Profit Sharing に基づく強化学習の理論と応用 (<特集>計算学習理論の進展と応用可能性)

書誌事項

タイトル別名
  • Theory and Applications of Reinforcement Learning Based on Profit Sharing (<Special Issue>"Recent Dvelopments in the Theory and Applications of Machine Learning")
  • Profit Sharingに基づく強化学習の理論と応用
  • Profit Sharing ニ モトヅク キョウカ ガクシュウ ノ リロン ト オウヨウ

この論文をさがす

説明

<p>1・1 工学の視点からみた強化学習 強化学習とは, 報酬という特別な人力を手がかりに環境に適応した行動決定戦略を追求する機械学習システムである. 強化学習の重要な特徴に, 1)報酬駆動型学習であること, 2)環境に対する先見的知識を前提としないこと, の2点がある. このことは, 「何をして欲しいか(what)」という目標を報酬に反映させるだけで, 「その実現方法(how to)」を学習システムに獲得させることを意味する. 強化学習システムは, 人間が考えた以上の解を発見する可能性がある. 加えて, 環境の一部が予め既知な場合には, 知識を組み込むことも可能である. この場合, 知識ベースが不完全であってもあるいは多少の誤りが含まれていても構わない. また, 強化学習は, ニューロやファジィなどの既存の手法との親和性が高い. さらに, 緩やかな環境変化には追従可能である. これらの理由から, 強化学習は工学的応用の観点から非常に魅力的な枠組と言える.</p>

収録刊行物

  • 人工知能

    人工知能 14 (5), 800-807, 1999-09-01

    一般社団法人 人工知能学会

被引用文献 (41)*注記

もっと見る

参考文献 (27)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ