Author,Title,Journal,ISSN,Publisher,Date,Volume,Number,Page,URL,URL(DOI) "山田, 智也 and 長坂, 保典",将来の状態と行動価値を考慮した内的報酬を利用する強化学習,中部大学工学部紀要,2187-7408,中部大学工学部,2021-03,56,,37-44,https://cir.nii.ac.jp/crid/1050569690513181312,