LVLMsにおけるAttention Mapと勾配情報を活用したObject Hallucinationの検出と修正

山路 和希, 高木 友博

doi:10.11517/pjsai.jsai2024.0_4i3gs703

書誌事項

タイトル別名

Detection and Correction of Object Hallucination using Attention Map and Gradient Information in LVLMs

説明

<p>Large Language Models(LLM)の卓越した言語処理能力に刺激を受け、近年、複雑なマルチモーダルタスクの性能向上を目的として、強力なLLMを組み込んだ Large Vision Language Models(LVLMs)の開発が進められている。しかし、これらLVLMsには、不適切な認識により、画像内に存在しない物体や物体同士の間違った関係性を記述してしまう問題(Object Hallucination)が存在する。そこでこの問題に対処するため、我々は、Object Hallucinationを検知し、修正を行うフレームワークを提案するこのフレームワークでは、LVLMs内のAttention Mapや勾配情報などを元に、Object Hallucinationが発生する原因となった画像の特定部分を特定・検知し、その修正を行う。実験を通じて、提案手法によりObject Hallucinationの発生が軽減されることを、複数の定量的指標を用いて確認した。</p>

収録刊行物

人工知能学会全国大会論文集

人工知能学会全国大会論文集 JSAI2024 (0), 4I3GS703-4I3GS703, 2024

一般社団法人人工知能学会

キーワード

詳細情報詳細情報について

CRID: 1390581920995884288

DOI: 10.11517/pjsai.jsai2024.0_4i3gs703

ISSN: 27587347

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘