スペクトルサブバンドセントロイドを用いた雑音下での音声認識

書誌事項

タイトル別名
  • Noise environment speech recognition using spectral subband centroids

この論文をさがす

説明

音声認識システムを実環境下で使用する場合、背景雑音等で音響モデルの学習環境と認識環境とのミスマッチが生じることが多い。このような環境のミスマッチに対し、ケプストラム等の特徴パラメータは大きく変動してしまうため、認識性能の劣化を引き起こす。本報告では、スペクトル・サブバンド・セントロイド (SSC) を補助的パラメータとして用いることにより、環境のミスマッチによる認識性能の劣化が低減できることを示す。SSCは、ナイキスト周波数をサブバンドに分割したときの各々のサブバンド内のパワースペクトルのセントロイド周波数として定義される。このセントロイド周波数は、雑音下においても変動が少ないため、環境のミスマッチに対してロバストな特徴パラメータであると考えられる。自然発話を用いた音声認識実験結果より、Mel-Frequency Cepstral Coefficients (MFCC) の補助的パラメータとしてSSCとMFCCの二次回帰係数を併用した場合、SNR=10dBにおいて14.3%、SNR=20dBにおいて19.9%の誤り改善率を得ることができた。

収録刊行物

参考文献 (15)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570009752305340928
  • NII論文ID
    110002954468
  • NII書誌ID
    AN10442647
  • ISSN
    09196072
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ