モンテカルロ木探索を用いた個人性のある画像キャプション生成
書誌事項
- タイトル別名
-
- Personalized Image Caption Generation Using Monte Carlo Tree Search
抄録
<p>本研究では画像キャプション生成において、個人性を持つ説明文を生成することを目的とする。ここでの個人性には画像に対して注目する観点や、言い回しなどが含まれる。大規模言語モデルの発展に伴い、様々な言語タスクで優れた成果が得られている。文の生成のタスクにおいて個人性を再現しようとした場合、言語モデルを個人から得た学習データから調整することが考えられる。しかしながら個人からのデータの収集には限界があり、少量のデータしか得られないことがほとんどである。そこで本論文では文章生成におけるトークン生成順序の探索について着目し、この探索において少量のデータから学習した個人識別モデルとモンテカルロ木探索を用いることを提案する。実験では一般に用いられるビームサーチと比べて提案手法が幅広い文章を生成できることを示し、また個人性の再現において有益であるを示す。</p>
収録刊行物
-
- 人工知能学会研究会資料 言語・音声理解と対話処理研究会
-
人工知能学会研究会資料 言語・音声理解と対話処理研究会 100 (0), 01-06, 2024-02-20
一般社団法人 人工知能学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390862157392167040
-
- ISSN
- 24364576
- 09185682
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用可