視覚情報を用いた対話型物体特定タスクにおける質問数削減手法の検討

この論文をさがす

抄録

Goal-oriented visual dialogue (GOVD)は,視覚的に提示された物体群から言語による質問を通じて相手の注目する物体を特定するタスクである.GOVDにおいては,深層学習を用いた質問生成と対象となる物体の特定をend-to-endに学習する手法が提案されてきた.しかし,これらの手法では予め決められた上限まで質問する方策を取ることが多く,冗長な質問が生じる課題が生じていた.これは人間と対話エージェントがインタラクションを行う際には大きなストレスとなり得る.そこで,本研究ではGOVDにおいてより少ない質問回数でユーザーの参照する物体を推測する手法の検討を行う.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ