マルチモーダル非言語行動に基づく対話者の視線機能の認識

田代 絢子, 今村 まい, 熊野 史朗, 大塚 和弘

doi:10.14923/transfunj.2023jap1003

人の対話における視線の機能に焦点を当て，これを対話者の非言語行動から認識するための研究の枠組みを提案する．対話において視線行動は，他者を観察する以外にも，感情・態度の表出や対話の流れの調整などの重要な役割を果たす．従来，対話中の対人視線方向を頭部姿勢や眼球方向などから推定する方法が提案されているが，視線の機能を認識の対象とした取り組みはまだ行われていない．そこで本論文では視線機能の認識という新たな問題を設定し，その解決の枠組みを示す．まず最初に43種の視線機能を定義し，対話中の時刻ごとに各機能の有無を非排他的に記述したコーパス，及び，その分析例を示す．次に14種の視線機能を対象とし，これを対話者の非言語行動から認識する深層学習モデルを提案する．具体的には入力モダリティとして，頭部運動，発話状態，注視状態，眼球方向，及び，顔表情を用い，各々の視線機能の有無の認識を行う畳み込みニューラルネット(CNN)を提案する．実験の結果，14機能の平均認識性能（F値）がチャンスレートから0.243の大幅な向上を遂げ，また，他者を見ながら傾聴するという機能において，最高0.839のF値を達成するなど，視線機能の認識可能性が示唆された．

マルチモーダル非言語行動に基づく対話者の視線機能の認識

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

マルチモーダル非言語行動に基づく対話者の視線機能の認識

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について