映像検索における効率的なプロンプトエンジニアリングの検討
書誌事項
- タイトル別名
-
- Investigation of efficient prompt engineering for video retrieval
抄録
近年,Vision and Language の技術が発展している.それに伴い,映像検索の分野も発展している.本研究では,Vision and Language の手法を映像検索に用いる際,入力となるクエリ文の変化による精度の変化を検証した.検証した内容は,検証内容 1「クエリ文の最初にフレーズを付与する」,検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」の 2 種類である.結果として,検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」は有効であった.特に文末に重要語をつけた場合多くのパターンで精度が向上した.検証内容 1「クエリ文の最初にフレーズを付与する」はフレーズによって結果が異なる.精度が向上するフレーズでは特に CLIP 及び SLIP で有効であった.また,クエリ文とプロンプトエンジニアリングをした文の 2 つを用いて検索をすると,大きく精度が向上することが少なくなったがより多くのクエリ文で精度が向上するようになった.
収録刊行物
-
- 画像電子学会研究会講演予稿
-
画像電子学会研究会講演予稿 22.04 (0), 102-105, 2023
一般社団法人 画像電子学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390298986213401088
-
- ISSN
- 27589218
- 02853957
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用不可