動画像のOptical Flowを用いた発声単語認識システム

書誌事項

タイトル別名
  • Visual Recognition of Spoken Words Using Optical Flow
  • ドウガゾウ ノ Optical Flow オ モチイタ ハッセイ タンゴ ニンシキ システム

この論文をさがす

説明

本論文では,発話時の顔の動画像から抽出される口周辺の動きの情報を用いることによって,音情報によらずに発声単語の自動識別を行うシステムについて述べる.時系列画像の各画素における動きをOptical Flowの算出によって求め,これらから口の周辺の速度の空間的な変化を表す特徴を抽出した.この速度特徴を用いて,発話の時間間隔を決定し,単語発声時の速度分布の時間的変化を表す高次元の特徴ベクトルを求めた.提案された特徴による発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話5単語の識別実験を行い,良好な結果が得られた.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ