映像検索における効率的なプロンプトエンジニアリングの検討

鈴木 和也, 千葉 晃裕, 植木 一也

doi:10.11371/wiieej.22.04.0_102

書誌事項

タイトル別名

Investigation of efficient prompt engineering for video retrieval

抄録

近年，Vision and Language の技術が発展している．それに伴い，映像検索の分野も発展している．本研究では，Vision and Language の手法を映像検索に用いる際，入力となるクエリ文の変化による精度の変化を検証した．検証した内容は，検証内容 1「クエリ文の最初にフレーズを付与する」，検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」の 2 種類である．結果として，検証内容 2「クエリ文内の重要語を文末もしくは文頭につける」は有効であった．特に文末に重要語をつけた場合多くのパターンで精度が向上した．検証内容 1「クエリ文の最初にフレーズを付与する」はフレーズによって結果が異なる．精度が向上するフレーズでは特に CLIP 及び SLIP で有効であった．また，クエリ文とプロンプトエンジニアリングをした文の 2 つを用いて検索をすると，大きく精度が向上することが少なくなったがより多くのクエリ文で精度が向上するようになった．

収録刊行物

画像電子学会研究会講演予稿

画像電子学会研究会講演予稿 22.04 (0), 102-105, 2023

一般社団法人画像電子学会

キーワード

詳細情報詳細情報について

CRID: 1390298986213401088

DOI: 10.11371/wiieej.22.04.0_102

ISSN: 27589218; 02853957

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

映像検索における効率的なプロンプトエンジニアリングの検討

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

映像検索における効率的なプロンプトエンジニアリングの検討

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について