画像キャプショニングモデルの言語化プロセスの可視化に関する研究

画像キャプショニングモデルの言語化プロセスの可視化に関する研究

KAKEN

越仲孝文

研究代表者

横浜市立大学

研究課題情報

体系的番号: JP24K15012 (JGN)

助成事業: 科学研究費助成事業

資金配分機関情報: 日本学術振興会(JSPS)

科研費情報

研究課題/領域番号: 24K15012

研究種目: 基盤研究(C)

配分区分

基金

審査区分/研究分野

小区分61010:知覚情報処理関連

研究機関

横浜市立大学

研究期間 (年度): 2024-04-01 〜 2027-03-31

研究課題ステータス: 交付

配分額*注記: 4,550,000 円 (直接経費: 3,500,000 円間接経費: 1,050,000 円)

研究概要

大規模言語モデルや画像生成モデルといったブラックボックス型の生成AIが人々に期待と不安を与えている．そこで本研究では，生成AIの中では比較的注目されていない画像キャプショニング，すなわち画像説明文生成を取り上げる．音声に含まれる言語情報(発話内容)をテキスト化する音声認識からのアナロジーで，画像説明文生成モデルが画像の何を言語情報として抽出しているのか，逆に何を抽出していないのかを，画像認識モデルとの比較や説明可能AIの手法によって明らかにする．本研究を通して画像説明文生成タスクにおける生成AIの挙動に関する有益な知見を得て，将来の生成AIの安心・安全な普及に貢献する．

詳細情報詳細情報について

CRID

1040581224889241856
Web Site

https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-24K15012/
本文言語コード

ja
データソース種別
- KAKEN

書き出し

ページトップへ

画像キャプショニングモデルの言語化プロセスの可視化に関する研究

研究課題情報

科研費情報

研究概要

関連論文

関連研究データ

関連図書・雑誌

関連博士論文

関連プロジェクト

関連その他成果物

キーワード

詳細情報詳細情報について

書き出し

画像キャプショニングモデルの言語化プロセスの可視化に関する研究

研究課題情報

科研費情報

研究概要

関連論文

関連研究データ

関連図書・雑誌

関連博士論文

関連プロジェクト

関連その他成果物

キーワード

詳細情報 詳細情報について

書き出し

詳細情報詳細情報について