動画像のOptical Flowを用いた発声単語認識システム

中村 亮太, 赤松 茂

doi:10.11371/wiieej.08-05.0_49

書誌事項

タイトル別名

Visual Recognition of Spoken Words Using Optical Flow
ドウガゾウノ Optical Flow オモチイタハッセイタンゴニンシキシステム

この論文をさがす

説明

本論文では,発話時の顔の動画像から抽出される口周辺の動きの情報を用いることによって,音情報によらずに発声単語の自動識別を行うシステムについて述べる.時系列画像の各画素における動きをOptical Flowの算出によって求め,これらから口の周辺の速度の空間的な変化を表す特徴を抽出した.この速度特徴を用いて,発話の時間間隔を決定し,単語発声時の速度分布の時間的変化を表す高次元の特徴ベクトルを求めた.提案された特徴による発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話５単語の識別実験を行い,良好な結果が得られた.

収録刊行物

画像電子学会研究会講演予稿

画像電子学会研究会講演予稿 08-05 (0), 49-55, 2009

一般社団法人画像電子学会

キーワード

詳細情報詳細情報について

CRID: 1390282680574565760

NII論文ID: 130005442089

NII書誌ID: AN00348041

DOI: 10.11371/wiieej.08-05.0_49

ISSN: 27589218; 02853957

NDL書誌ID: 10211494

Web Site: http://id.ndl.go.jp/bib/10211494; https://ndlsearch.ndl.go.jp/books/R000000004-I10211494

資料種別: journal article

データソース種別

JaLC
NDLサーチ
CiNii Articles
KAKEN

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘