映像検索における効率的なプロンプトエンジニアリングの検討

DOI

書誌事項

タイトル別名
  • Investigation of efficient prompt engineering for video retrieval

抄録

近年,Vision and Language の技術が発展している.それに伴い,映像検索の分野も発展している.本研究では,Vision and Language の手法を映像検索に用いる際,入力となるクエリ文の変化による精度の変化を検証した.検証した内容は,検証内容 1「クエリ文の最初にフレーズを付与する」,検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」の 2 種類である.結果として,検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」は有効であった.特に文末に重要語をつけた場合多くのパターンで精度が向上した.検証内容 1「クエリ文の最初にフレーズを付与する」はフレーズによって結果が異なる.精度が向上するフレーズでは特に CLIP 及び SLIP で有効であった.また,クエリ文とプロンプトエンジニアリングをした文の 2 つを用いて検索をすると,大きく精度が向上することが少なくなったがより多くのクエリ文で精度が向上するようになった.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390298986213401088
  • DOI
    10.11371/wiieej.22.04.0_102
  • ISSN
    27589218
    02853957
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ