画像キャプショニングモデルの言語化プロセスの可視化に関する研究

研究課題情報

体系的番号
JP24K15012 (JGN)
助成事業
科学研究費助成事業
資金配分機関情報
日本学術振興会(JSPS)

科研費情報

研究課題/領域番号
24K15012
研究種目
基盤研究(C)
配分区分
  • 基金
審査区分/研究分野
  • 小区分61010:知覚情報処理関連
研究機関
  • 横浜市立大学
研究期間 (年度)
2024-04-01 〜 2027-03-31
研究課題ステータス
交付
配分額*注記
4,550,000 円 (直接経費: 3,500,000 円 間接経費: 1,050,000 円)

研究概要

大規模言語モデルや画像生成モデルといったブラックボックス型の生成AIが人々に期待と不安を与えている.そこで本研究では,生成AIの中では比較的注目されていない画像キャプショニング,すなわち画像説明文生成を取り上げる.音声に含まれる言語情報(発話内容)をテキスト化する音声認識からのアナロジーで,画像説明文生成モデルが画像の何を言語情報として抽出しているのか,逆に何を抽出していないのかを,画像認識モデルとの比較や説明可能AIの手法によって明らかにする.本研究を通して画像説明文生成タスクにおける生成AIの挙動に関する有益な知見を得て,将来の生成AIの安心・安全な普及に貢献する.

関連論文

もっと見る

関連研究データ

もっと見る

関連図書・雑誌

もっと見る

関連博士論文

もっと見る

関連プロジェクト

もっと見る

関連その他成果物

もっと見る

詳細情報 詳細情報について

ページトップへ