メタヒューリティクスによる強化学習のパラメータの最適化

  • 安政 駿
    筑波大学院 図書館情報メディア研究科 図書館情報メディア専攻
  • 手塚 太郎
    筑波大学 図書館情報メディア系

説明

<p>強化学習は機械学習の手法の一つとして広く使われているが、学習に先立ち報酬の決定や方策を更新する際に用いられるパラメータを決定する必要がある。しかし複雑な環境において最適なパラメータを見つけ出すことは多くの試行錯誤を伴い、容易ではない。本研究では、焼きなまし法などの特定の計算問題に依存しないメタヒューリティクスのアルゴリズムを用いることで、自動的に最適なパラメータを導き出す手法を提案する。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390564237999851520
  • NII論文ID
    130007423655
  • DOI
    10.11517/pjsai.jsai2014.0_2h13in
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ