Optimal threshold probability in undiscounted Markov decision processes with a target set

Yoshio Ohtsubo

doi:10.1016/s0096-3003(03)00158-9

Optimal threshold probability in undiscounted Markov decision processes with a target set

DOI Web Site Web Site 被引用文献2件

Yoshio Ohtsubo

書誌事項

公開日: 2004-02

権利情報

https://www.elsevier.com/tdm/userlicense/1.0/

DOI

10.1016/s0096-3003(03)00158-9

公開者: Elsevier BV

この論文をさがす

CiNii Books

説明

We consider risk minimizing problems in undiscounted Markov decisions processes with a target set. We formulate the problem as an infinite horizon case with a recurrent class. We show that an optimal value function is a unique solution to an optimality equation and there exists an stationary optimal policy. Also we give several value iteration methods and a policy improvement method.

収録刊行物

Applied Mathematics and Computation

Applied Mathematics and Computation 149 (2), 519-532, 2004-02

Elsevier BV

被引用文献 (2)*注記

CRID

1361699995184455936
DOI

10.1016/s0096-3003(03)00158-9
ISSN

00963003
Web Site

https://api.elsevier.com/content/article/PII:S0096300303001589?httpAccept=text/xml

https://api.elsevier.com/content/article/PII:S0096300303001589?httpAccept=text/plain
データソース種別
- Crossref
- OpenAIRE

書き出し

問題の指摘

ページトップへ

Optimal threshold probability in undiscounted Markov decision processes with a target set

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (2)*注記

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について