決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング

書誌事項

タイトル別名
  • ケッテイギ ニ モトヅク オンソ コンテクスト ジゲン ジョウタイ イチ ノ ドウジ クラスタリング ニ ヨル オンキョウ モデリング
  • ケッテイギ ニモトズク オンソ コンテクスト ジゲン ジョウタイ イチ ノ ドウジ クラスタリング ニヨル オンキョウ モデリング
  • Decision Tree Based Simultaneous Clustering of Phonetic Contexts, Dimensions, and State Positions for Acoustic Modeling

この論文をさがす

抄録

近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割り当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13~15%誤り率を削減することが示された.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (22)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ