マルコフ決定過程におけるTD法による学習アルゴリズムについて

書誌事項

タイトル別名
  • マルコフ ケッテイ カテイ ニ オケル TDホウ ニ ヨル ガクシュウ アルゴリズム ニ ツイテ
  • A learning algorithm of TD method for Markov decision processes
  • 最適化問題における確率モデルの展開と応用--RIMS共同研究報告集
  • サイテキカ モンダイ ニ オケル カクリツ モデル ノ テンカイ ト オウヨウ RIMS キョウドウ ケンキュウ ホウコクシュウ

この論文をさがす

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ