文脈効果のモデル化とそれを用いたワードスポッティング
Bibliographic Information
- Other Title
-
- ブンミャク コウカ ノ モデルカ ト ソレ オ モチイタ ワード スポッティン
- Modeling of Contextual Effects and Its Application to Word Spotting
Search this article
Description
人間は聴覚の補正機構の働きにより, 調音結合のためになまけた音韻であっても正しく認識することができる. 本論文では, 聴覚の補正現象の一つとして考えられる文脈効果をモデル化し, モデルをワードスポッティングの前処理として用いる. モデルは近接したスペクトルピークの影響で人間の知覚するスペクトルが本来のスペクトルに比べ変化することを記述したものであり, 報告されている心理実験の結果をもとに, 最小分類誤り学習によりモデル化を行った. 次に, モデルの能力を検証するため, モデル適用によるホルマント軌跡の変化を調べた. その結果, モデルには調音結合のため連続音声中に現れる「なまけ」を回復する働きがあることがわかった. また, モデルを前処理として用いた母音認識実験を行い, その結果, モデルを用いることにより有意な認識率の向上が見られた. 更に, モデルを前処理として用いたワードスポッティング実験を行った. その結果, 単語検出率が1-6ポイント程度向上し, モデルが前処理として有効に機能することを示した.
identifier:https://dspace.jaist.ac.jp/dspace/handle/10119/4928
Journal
-
- 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理
-
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 J80-D-II (1), 36-43, 1997-01-25
電子情報通信学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050845762467323648
-
- NII Article ID
- 110003228732
-
- NII Book ID
- AN1007132X
-
- ISSN
- 09151923
-
- NDL BIB ID
- 4128772
-
- Text Lang
- ja
-
- Article Type
- journal article
-
- Data Source
-
- IRDB
- NDL
- CiNii Articles