著者名,論文名,雑誌名,ISSN,出版者名,出版日付,巻,号,ページ,URL,URL(DOI) 冨山翔司 and 鈴木雅大 and 落合桂一 and 松尾豊,文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案,電子情報通信学会論文誌D 情報・システム,1880-4535,"The Institute of Electronics, Information and Communication Engineers",2024-05-01,J107-D,5,348-358,https://cir.nii.ac.jp/crid/1390581412163991424,https://doi.org/10.14923/transinfj.2023dep0009