口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)
書誌事項
- タイトル別名
-
- 口唇動作と音声の共起に着目した被写体と話者の不一致検出--ニュース映像への適用と評価
- コウシン ドウサ ト オンセイ ノ キョウキ ニ チャクモク シタ ヒシャタイ ト ワシャ ノ フイッチ ケンシュツ ニュース エイゾウ エ ノ テキヨウ ト ヒョウカ
- Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio : An Application to News Video and its Evaluation
この論文をさがす
説明
ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら2つの実験から,提案手法の有効性および有用性を確認した.
収録刊行物
-
- 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎
-
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 111 (38), 75-80, 2011-05-06
一般社団法人電子情報通信学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050564288758179328
-
- NII論文ID
- 110008584201
- 110008726196
-
- NII書誌ID
- AA1123312X
-
- HANDLE
- 2237/23846
-
- NDL書誌ID
- 11116671
-
- ISSN
- 09135685
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles