書誌事項
- タイトル別名
-
- ケッテイギ ニ モトヅク オンソ コンテクスト ジゲン ジョウタイ イチ ノ ドウジ クラスタリング ニ ヨル オンキョウ モデリング
- ケッテイギ ニモトズク オンソ コンテクスト ジゲン ジョウタイ イチ ノ ドウジ クラスタリング ニヨル オンキョウ モデリング
- Decision Tree Based Simultaneous Clustering of Phonetic Contexts, Dimensions, and State Positions for Acoustic Modeling
この論文をさがす
抄録
近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割り当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13~15%誤り率を削減することが示された.
収録刊行物
-
- 電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理
-
電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 J87-D2 (8), 1593-1602, 2004-08-01
Institute of Electronics, Information and Communication Engineers
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050845762422570624
-
- NII論文ID
- 110003171149
-
- NII書誌ID
- AA11340957
-
- ISSN
- 09151923
-
- NDL書誌ID
- 7053186
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles