スペクトルサブバンドセントロイドを用いた雑音下での音声認識
-
- 柘植 覚
- ATR音声翻訳通信研究所
-
- 深田 俊明
- ATR音声翻訳通信研究所
-
- シンガー ハラルド
- ATR音声翻訳通信研究所
-
- パリワル クルディップ
- ATR音声翻訳通信研究所
書誌事項
- タイトル別名
-
- Noise environment speech recognition using spectral subband centroids
この論文をさがす
説明
音声認識システムを実環境下で使用する場合、背景雑音等で音響モデルの学習環境と認識環境とのミスマッチが生じることが多い。このような環境のミスマッチに対し、ケプストラム等の特徴パラメータは大きく変動してしまうため、認識性能の劣化を引き起こす。本報告では、スペクトル・サブバンド・セントロイド (SSC) を補助的パラメータとして用いることにより、環境のミスマッチによる認識性能の劣化が低減できることを示す。SSCは、ナイキスト周波数をサブバンドに分割したときの各々のサブバンド内のパワースペクトルのセントロイド周波数として定義される。このセントロイド周波数は、雑音下においても変動が少ないため、環境のミスマッチに対してロバストな特徴パラメータであると考えられる。自然発話を用いた音声認識実験結果より、Mel-Frequency Cepstral Coefficients (MFCC) の補助的パラメータとしてSSCとMFCCの二次回帰係数を併用した場合、SNR=10dBにおいて14.3%、SNR=20dBにおいて19.9%の誤り改善率を得ることができた。
収録刊行物
-
- 情報処理学会研究報告. SLP, 音声言語情報処理
-
情報処理学会研究報告. SLP, 音声言語情報処理 19 23-28, 1997-12-11
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1570009752305340928
-
- NII論文ID
- 110002954468
-
- NII書誌ID
- AN10442647
-
- ISSN
- 09196072
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles