マルコフ決定過程におけるTD法による学習アルゴリズムについて

Web Site

Bibliographic Information

Other Title

マルコフケッテイカテイニオケル TDホウニヨルガクシュウアルゴリズムニツイテ
A learning algorithm of TD method for Markov decision processes
最適化問題における確率モデルの展開と応用--RIMS共同研究報告集
サイテキカモンダイニオケルカクリツモデルノテンカイトオウヨウ RIMS キョウドウケンキュウホウコクシュウ

Search this article

Journal

数理解析研究所講究録

数理解析研究所講究録 (1559), 34-49, 2007-06

[京都] : 京都大学数理解析研究所

Details 詳細情報について

CRID

1520290885014152192
NII Article ID

110006279800
NII Book ID

AN00061013
ISSN

18802818
NDL BIB ID

8804037
Web Site

http://id.ndl.go.jp/bib/8804037

https://ndlsearch.ndl.go.jp/books/R000000004-I8804037
Text Lang

ja
NDL Source Classification
- ZM31(科学技術--数学)
Data Source
- NDL
- CiNii Articles

Export

Report a problem

Back to top