文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案

冨山 翔司, 鈴木 雅大, 落合 桂一, 松尾 豊

doi:10.14923/transinfj.2023dep0009

書誌事項

タイトル別名

GIRL: Reward Function Learning Framework Independent of Text Generator Samples for Reinforcement Learning in Text Generation Tasks

抄録

文書生成タスクにおいて，強化学習は有効な手法であると知られている．過去の研究で提案された手法はいずれも，報酬関数の人手による設計の難しさからデータによる学習を試み，その際に文書生成器のサンプルを用いていた．本論文では，報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる，学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し，報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する．本フレームワークに則った手法では，文書生成器の学習を定量的に可視化でき，かつ，代表的な文書生成タスクに対する強化学習応用手法に対して，性能面でも上回ることを確認した．

収録刊行物

電子情報通信学会論文誌D 情報・システム

電子情報通信学会論文誌D 情報・システム J107-D (5), 348-358, 2024-05-01

The Institute of Electronics, Information and Communication Engineers

キーワード

詳細情報詳細情報について

CRID: 1390581412163991424

DOI: 10.14923/transinfj.2023dep0009

ISSN: 18810225; 18804535

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について