Optimizing Betting Fraction in Compound Reinforcement Learning Using Online Gradient Method

MATSUI Tohgoroh, GOTO Takashi, IZUMI Kiyoshi, CHEN Yu

doi:10.11517/jsaisigtwo.2012.fin-008_07

Bibliographic Information

Other Title

オンライン勾配法による投資比率最適化付き複利型強化学習

Description

<p>本論文では，複利型強化学習において，オンライン勾配法を用いて投資比率を最適化する方法を提案する．従来の複利型強化学習では，投資比率を固定としていたため，投資比率をどのように決めるかが問題となっていた．提案手法では，投資比率をオンライン勾配法によって最適化することによって，この問題を解決する．また，オンライン勾配法による投資比率最適化付きQ 学習を3 本腕バンディット問題に適用し，投資比率固定の複利型Q 学習およびQ 学習と比較し，その有効性を示す．</p>

Journal

JSAI Technical Report, Type 2 SIG

JSAI Technical Report, Type 2 SIG 2012 (FIN-008), 07-, 2012-01-28

The Japanese Society for Artificial Intelligence

Details 詳細情報について

CRID: 1390294740098273280

DOI: 10.11517/jsaisigtwo.2012.fin-008_07

ISSN: 24365556

Text Lang: ja

Data Source

JaLC

Abstract License Flag: Allowed

Export