口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)

書誌事項

タイトル別名
  • 口唇動作と音声の共起に着目した被写体と話者の不一致検出--ニュース映像への適用と評価
  • コウシン ドウサ ト オンセイ ノ キョウキ ニ チャクモク シタ ヒシャタイ ト ワシャ ノ フイッチ ケンシュツ ニュース エイゾウ エ ノ テキヨウ ト ヒョウカ
  • Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio : An Application to News Video and its Evaluation

この論文をさがす

説明

ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら2つの実験から,提案手法の有効性および有用性を確認した.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (11)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ