マルコフ決定過程におけるTD法による学習アルゴリズムについて
Bibliographic Information
- Other Title
-
- マルコフ ケッテイ カテイ ニ オケル TDホウ ニ ヨル ガクシュウ アルゴリズム ニ ツイテ
- A learning algorithm of TD method for Markov decision processes
- 最適化問題における確率モデルの展開と応用--RIMS共同研究報告集
- サイテキカ モンダイ ニ オケル カクリツ モデル ノ テンカイ ト オウヨウ RIMS キョウドウ ケンキュウ ホウコクシュウ
Search this article
Journal
-
- 数理解析研究所講究録
-
数理解析研究所講究録 (1559), 34-49, 2007-06
[京都] : 京都大学数理解析研究所
- Tweet
Details 詳細情報について
-
- CRID
- 1520290885014152192
-
- NII Article ID
- 110006279800
-
- NII Book ID
- AN00061013
-
- ISSN
- 18802818
-
- NDL BIB ID
- 8804037
-
- Text Lang
- ja
-
- NDL Source Classification
-
- ZM31(科学技術--数学)
-
- Data Source
-
- NDL
- CiNii Articles