決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング

全, 炳河, 徳田, 恵一, 北村, 正

書誌事項

タイトル別名

ケッテイギニモトヅクオンソコンテクストジゲンジョウタイイチノドウジクラスタリングニヨルオンキョウモデリング
ケッテイギ　ニモトズク　オンソ　コンテクスト　ジゲン　ジョウタイ　イチ　ノ　ドウジ　クラスタリング　ニヨル　オンキョウ　モデリング
Decision Tree Based Simultaneous Clustering of Phonetic Contexts, Dimensions, and State Positions for Acoustic Modeling

この論文をさがす

抄録

近年，連続音声認識システムにおける音響モデルとして，前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている．音素コンテクスト依存隠れマルコフモデルを利用する場合，総モデル数が増加し，システムが非常に多くの自由パラメータを含むことになるため，統計的に信頼できるパラメータを推定することが困難になる．このため，様々なパラメータ共有手法が提案されており，中でも音素決定木に基づく状態共有法は，優れた解決法の一つである．しかし，状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため，各特徴量に対し，異なる共有構造を構築できない，適切なパラメータ数を割り当てることができない，といった問題点がある．本論文では，記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した，音素・次元決定木を提案する．更に，状態位置に関する分割条件を加え，音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する．不特定話者連続音声認識実験の結果，提案法は従来の音素決定木に基づく状態共有法と比較して13～15％誤り率を削減することが示された．

収録刊行物

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 J87-D2 (8), 1593-1602, 2004-08-01

Institute of Electronics, Information and Communication Engineers

キーワード

詳細情報詳細情報について

CRID: 1050845762422570624

NII論文ID: 110003171149

NII書誌ID: AA11340957

ISSN: 09151923

NDL書誌ID: 7053186

Web Site: http://id.nii.ac.jp/1476/00005201/; http://id.ndl.go.jp/bib/7053186; https://ndlsearch.ndl.go.jp/books/R000000004-I7053186

本文言語コード: ja

資料種別: journal article

データソース種別

IRDB
NDL
CiNii Articles

決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (22)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (22)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について