連続時間ベクトル値マルコフ決定過程の凸最適解の研究
研究課題情報
- 体系的番号
- JP06640324 (JGN)
- 助成事業
- 科学研究費助成事業
- 資金配分機関情報
- 日本学術振興会(JSPS)
科研費情報
- 研究課題/領域番号
- 06640324
- 研究種目
- 一般研究(C)
- 配分区分
-
- 補助金
- 審査区分/研究分野
-
- 理学 > 数学 > 数学一般(含確率論・統計数学)
- 研究機関
-
- 宮崎大学
- 研究期間 (年度)
- 1994 〜 1994
- 研究課題ステータス
- 完了
- 配分額*注記
- 2,100,000 円 (直接経費: 2,100,000 円)
研究概要
以下の2つの研究集会にて講演を行い成果の発表を行った。 [I]平成6年11月10日,京都大学数理解析研究所における研究集会にて 題目:「(U,V,W)基準をもつベクトル値マルコフ決定過程について」 として数値計算例を含めて講演した。 理論的側面の一部の結果は,同研究所の講究録に収録され印刷中である。次の[II]の研究の基礎となる部分であり,割引率を伴う単一のマルコフ連鎖を中心にして,推移確率行列に対する固有多項式の正定値性と余因数行列との関係を明らかにした。 [II]平成6年12月7日-12月9日 創価大学理工学部における研究集会にて 題目:「多重連鎖をなすベクトル値マルコフ決定過程について」 として講演した。 結果は研究集会誌 「不確実性の下での最適化理論とその関連分野」P.8-17 に収録され概要を印刷発表した。ここに,[II]の講演内容の要旨を報告する。 内容:ベクトル値の有限マルコフ決定過程において,マルコフ推移確率行列の中に潜む部分連鎖の数に応じた最適性の判定法に関する理論を構築した。それは Lemma2.1-2.4 および定理4.1-4.3から構成されている。平均型基準値,相対値および準相対値の系列をもち,優劣の判定がベクトル値による半順序で決定される最適化方程式と大域的最適解の発見法が与えられた。これによって最適政策の決定法を導いた。[I]および[II]の数値計算例はページ数の関係で未収録である。その分は平成7年度の宮崎大学教育学部の研究紀要等で発表する予定である。理論的側面を中心にした部分は,外国雑誌等にこれから投稿する予定である。
詳細情報 詳細情報について
-
- CRID
- 1040282256605494528
-
- 本文言語コード
- ja
-
- データソース種別
-
- KAKEN