モンテカルロ木探索を用いた個人性のある画像キャプション生成

DOI

書誌事項

タイトル別名
  • Personalized Image Caption Generation Using Monte Carlo Tree Search

抄録

<p>本研究では画像キャプション生成において、個人性を持つ説明文を生成することを目的とする。ここでの個人性には画像に対して注目する観点や、言い回しなどが含まれる。大規模言語モデルの発展に伴い、様々な言語タスクで優れた成果が得られている。文の生成のタスクにおいて個人性を再現しようとした場合、言語モデルを個人から得た学習データから調整することが考えられる。しかしながら個人からのデータの収集には限界があり、少量のデータしか得られないことがほとんどである。そこで本論文では文章生成におけるトークン生成順序の探索について着目し、この探索において少量のデータから学習した個人識別モデルとモンテカルロ木探索を用いることを提案する。実験では一般に用いられるビームサーチと比べて提案手法が幅広い文章を生成できることを示し、また個人性の再現において有益であるを示す。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390862157392167040
  • DOI
    10.11517/jsaislud.100.0_01
  • ISSN
    24364576
    09185682
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用可

問題の指摘

ページトップへ