著者名,論文名,雑誌名,ISSN,出版者名,出版日付,巻,号,ページ,URL,URL(DOI) "山田, 智也 and 長坂, 保典",将来の状態と行動価値を考慮した内的報酬を利用する強化学習,中部大学工学部紀要,2187-7408,中部大学工学部,2021-03,56,,37-44,https://cir.nii.ac.jp/crid/1050569690513181312,