オンライン勾配法による投資比率最適化付き複利型強化学習

松井 藤五郎, 後藤 卓, 和泉 潔, 陳 昱

doi:10.11517/jsaisigtwo.2012.fin-008_07

書誌事項

タイトル別名

Optimizing Betting Fraction in Compound Reinforcement Learning Using Online Gradient Method

抄録

<p>本論文では，複利型強化学習において，オンライン勾配法を用いて投資比率を最適化する方法を提案する．従来の複利型強化学習では，投資比率を固定としていたため，投資比率をどのように決めるかが問題となっていた．提案手法では，投資比率をオンライン勾配法によって最適化することによって，この問題を解決する．また，オンライン勾配法による投資比率最適化付きQ 学習を3 本腕バンディット問題に適用し，投資比率固定の複利型Q 学習およびQ 学習と比較し，その有効性を示す．</p>

収録刊行物

人工知能学会第二種研究会資料

人工知能学会第二種研究会資料 2012 (FIN-008), 07-, 2012-01-28

一般社団法人人工知能学会

詳細情報詳細情報について

CRID: 1390294740098273280

DOI: 10.11517/jsaisigtwo.2012.fin-008_07

ISSN: 24365556

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用可

オンライン勾配法による投資比率最適化付き複利型強化学習

書誌事項

抄録

収録刊行物

詳細情報詳細情報について

書き出し

問題の指摘

オンライン勾配法による投資比率最適化付き複利型強化学習

書誌事項

抄録

収録刊行物

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について