Optimizing Betting Fraction in Compound Reinforcement Learning Using Online Gradient Method
-
- MATSUI Tohgoroh
- Chubu University
-
- GOTO Takashi
- Bank of Tokyo-Mitsubishi UFJ, Ltd.
-
- IZUMI Kiyoshi
- The University of Tokyo PRESTO, JST
-
- CHEN Yu
- The University of Tokyo
Bibliographic Information
- Other Title
-
- オンライン勾配法による投資比率最適化付き複利型強化学習
Description
<p>本論文では,複利型強化学習において,オンライン勾配法を用いて投資比率を最適化する方法を提案する.従来の複利型強化学習では,投資比率を固定としていたため,投資比率をどのように決めるかが問題となっていた.提案手法では,投資比率をオンライン勾配法によって最適化することによって,この問題を解決する.また,オンライン勾配法による投資比率最適化付きQ 学習を3 本腕バンディット問題に適用し,投資比率固定の複利型Q 学習およびQ 学習と比較し,その有効性を示す.</p>
Journal
-
- JSAI Technical Report, Type 2 SIG
-
JSAI Technical Report, Type 2 SIG 2012 (FIN-008), 07-, 2012-01-28
The Japanese Society for Artificial Intelligence
- Tweet
Details 詳細情報について
-
- CRID
- 1390294740098273280
-
- ISSN
- 24365556
-
- Text Lang
- ja
-
- Data Source
-
- JaLC
-
- Abstract License Flag
- Allowed