著者名,論文名,雑誌名,ISSN,出版者名,出版日付,巻,号,ページ,URL,URL(DOI) 冨山 翔司 and 鈴木 雅大 and 落合 桂一 and 松尾 豊,文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案,電子情報通信学会論文誌D 情報・システム,1880-4535,"The Institute of Electronics, Information and Communication Engineers",2024-05-01,J107-D,5,348-358,https://cir.nii.ac.jp/crid/1390581412163991424,https://doi.org/10.14923/transinfj.2023dep0009