口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)

熊谷, 章吾, 道満, 恵介, 高橋, 友和, 出口, 大輔, 井手, 一郎, 村瀬, 洋, KUMAGAI, Shogo, DOMAN, Keisuke, TAKAHASHI, Tomokazu, DEGUCHI, Daisuke, IDE, Ichiro, MURASE, Hiroshi

書誌事項

タイトル別名

口唇動作と音声の共起に着目した被写体と話者の不一致検出--ニュース映像への適用と評価
コウシンドウサトオンセイノキョウキニチャクモクシタヒシャタイトワシャノフイッチケンシュツニュースエイゾウエノテキヨウトヒョウカ
Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio : An Application to News Video and its Evaluation

この論文をさがす

説明

ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら2つの実験から,提案手法の有効性および有用性を確認した.

収録刊行物

電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎

電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 111 (38), 75-80, 2011-05-06

一般社団法人電子情報通信学会

キーワード

詳細情報詳細情報について

CRID: 1050564288758179328

NII論文ID: 110008584201; 110008726196

NII書誌ID: AA1123312X

HANDLE: 2237/23846

NDL書誌ID: 11116671

ISSN: 09135685

Web Site: https://nagoya.repo.nii.ac.jp/records/21697; http://id.ndl.go.jp/bib/11116671; https://ndlsearch.ndl.go.jp/books/R000000004-I11116671

本文言語コード: ja

資料種別: journal article

データソース種別

IRDB
NDL
CiNii Articles

口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (1)*注記

参考文献 (11)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)

書誌事項

この論文をさがす

説明

収録刊行物

被引用文献 (1)*注記

参考文献 (11)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について