オンライン勾配法による投資比率最適化付き複利型強化学習

DOI

書誌事項

タイトル別名
  • Optimizing Betting Fraction in Compound Reinforcement Learning Using Online Gradient Method

抄録

<p>本論文では,複利型強化学習において,オンライン勾配法を用いて投資比率を最適化する方法を提案する.従来の複利型強化学習では,投資比率を固定としていたため,投資比率をどのように決めるかが問題となっていた.提案手法では,投資比率をオンライン勾配法によって最適化することによって,この問題を解決する.また,オンライン勾配法による投資比率最適化付きQ 学習を3 本腕バンディット問題に適用し,投資比率固定の複利型Q 学習およびQ 学習と比較し,その有効性を示す.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390294740098273280
  • DOI
    10.11517/jsaisigtwo.2012.fin-008_07
  • ISSN
    24365556
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用可

問題の指摘

ページトップへ