書誌事項
- タイトル別名
-
- Visual Recognition of Spoken Words Using Optical Flow
- ドウガゾウ ノ Optical Flow オ モチイタ ハッセイ タンゴ ニンシキ システム
この論文をさがす
説明
本論文では,発話時の顔の動画像から抽出される口周辺の動きの情報を用いることによって,音情報によらずに発声単語の自動識別を行うシステムについて述べる.時系列画像の各画素における動きをOptical Flowの算出によって求め,これらから口の周辺の速度の空間的な変化を表す特徴を抽出した.この速度特徴を用いて,発話の時間間隔を決定し,単語発声時の速度分布の時間的変化を表す高次元の特徴ベクトルを求めた.提案された特徴による発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話5単語の識別実験を行い,良好な結果が得られた.
収録刊行物
-
- 画像電子学会研究会講演予稿
-
画像電子学会研究会講演予稿 08-05 (0), 49-55, 2009
一般社団法人 画像電子学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390282680574565760
-
- NII論文ID
- 130005442089
-
- NII書誌ID
- AN00348041
-
- ISSN
- 02853957
-
- NDL書誌ID
- 10211494
-
- データソース種別
-
- JaLC
- NDL
- CiNii Articles
- KAKEN
-
- 抄録ライセンスフラグ
- 使用不可