著者名,論文名,雑誌名,ISSN,出版者名,出版日付,巻,号,ページ,URL,URL(DOI) 宮崎 和光 and 小林 重信,離散マルコフ決定過程下での強化学習 (<特集> 強化学習),人工知能,09128085,一般社団法人 人工知能学会,1997-11-01,12,6,811-821,https://cir.nii.ac.jp/crid/1390285697602275584,https://doi.org/10.11517/jjsai.12.6_811