書誌事項
- タイトル別名
-
- 音声・状況の同時認識に基づく野球実況中継へのメタ情報付与
- オンセイ ジョウキョウ ノ ドウジ ニンシキ ニ モトズク ヤキュウ ジッキョウ チュウケイ エ ノ メタ ジョウホウ フヨ
- オンセイ ・ ジョウキョウ ノ ドウジ ニンシキ ニ モトズク スポーツ ジッキョウ チュウケイ エ ノ メタ ジョウホウ フヨ
- Extracting Meta-information for Sports Live Games Based on Speech and Situation Recognition
- 情報抽出、構造化
この論文をさがす
抄録
近年,多くのマルチメディア・コンテンツの所有が可能となってきた.大量のコンテンツの中から欲しい情報を得るためには,検索のためのメタ情報を付与しておく必要がある.本研究では,マルチメディア・コンテンツの一例としてスポーツ実況中継,特に野球実況中継に注目し,実況中継音声から音声認識を用いてメタ情報を抽出することを目的としている.野球のメタ情報としては,今何が起こっているかを表すイベントと,その積み重ねである状況が存在すると考えられる.まず,現実にイベントや状況が存在し,これを基にアナウンサは実況を行う.本研究では,実況音声から単語列だけを推定する音声認識を拡張し,実況音声から単語列・イベント系列・状況系列すべてを同時に推定する音声認識手法を提案する.定式化により,イベント依存音響モデル,状況遷移モデル,イベント推定モデル,状況依存言語モデルを得る.これらを確率の枠組みで統合的に用いることで,単語列とメタ情報の同時推定を行う.実験により,イベント検出F値0.87,イベント正解率0.86,状況正解率0.77を得た.その他,各モデルの「メタ情報付与性能」への寄与や,音声認識率と「メタ情報付与性能」との関係について考察を行う.
Recently a large quantity of multimedia contents are broadcast and accessed. In order to retrieve exactly what we want to know from multimedia database, automatic extraction of meta-information is required. We focused on live speeches, especially baseball commentary speeches as a kind of multimedia contents. The purpose of this study is to provide meta-information based on speech recognition techniques. Events and situations are defined as metainformation. First of all, an event is occured or a situation is changed, then an announcer speaks based on an event and a situation. In this paper, we propose a extended speech recognition technique that estimates not only a word sequence but also a event sequence and a situation sequence concurrently. As a result of formulation, event dependent acoustic model, situation transition model, event estimation model and situation dependent language model are derived. A word sequence and meta-information are estimated based on these models. The experimental results showed that the proposed method provided meta-information with a high degree of accuracy.
収録刊行物
-
- 情報処理学会論文誌
-
情報処理学会論文誌 50 (2), 563-574, 2009-02-15
[豊橋] : [豊橋技術科学大学メディア科学リサーチセンター]
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050845762811319040
-
- NII論文ID
- 40016585288
- 110007970352
-
- NII書誌ID
- AN00116647
-
- ISSN
- 18827764
- 18827837
- 03875806
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles
- KAKEN