時系列顔画像の動き特徴を用いた発声単語認識

書誌事項

タイトル別名
  • Recognition of Spoken Words Using Motion Features Extracted from Time Series Imagery
  • 時系列顔画像の動き特徴を用いた発声単語認識--特徴抽出の時間・空間的正規化条件の比較
  • ジケイレツ カオ ガゾウ ノ ウゴキ トクチョウ オ モチイタ ハッセイ タンゴ ニンシキ トクチョウ チュウシュツ ノ ジカン クウカンテキ セイキカ ジョウケン ノ ヒカク
  • -特徴抽出の時間・空間的正規化条件の比較-
  • - Comparison of Temporal and Spatial Normalization Condition of Feature Extraction -

この論文をさがす

抄録

本論文では,発話時の顔の動画像から抽出される動き特徴を用いることによって,音情報によらずに発声単語の識別を行うシステムについて述べる.時系列画像の各画素における動きをOptical Flowの算出によって求め,これらから空間的な変化を表す速度特徴を抽出した.この速度特徴を用いて,発話の時間間隔を決定し,単語発声時の速度分布の時間的変化を表す高次元の特徴ベクトルを求めた.提案された特徴による発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話5単語の識別実験を行い,良好な結果が得られた.また,口周辺だけでなくその他の領域の動き特徴を用いて識別を行った結果,発話単語認識は口周辺の動きだけに注目するより,顔全体の動きに注目した方がよいことがわかった.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ