砂時計型ニューラルネットによるLPCスペクトルの次元圧縮

書誌事項

タイトル別名
  • Reduction of LPC Spectrum Dimension Using a Wine-Glass-Type Neural Network

この論文をさがす

説明

中間層の素子数が, 入力層及び出力層の素子数よりも少ない構造を持つ砂時計型ニューラルネットワークを用いて恒等写像学習を行なうことにより, 音響的特徴空間の次元数の削減が実現できる. そこで, 入力層と出力層の素子数が32個で, 中間層の素子数が2〜5個である砂時計型ニューラルネットワークに対して, 32次元のLPC対数スペクトルを入力した時に出力が入力と同じになるようにして恒等写像を学習させる. この結果, 学習後の入力と出力のスペクトル歪みは, KL展開による次元圧縮の場合に比べて小さかった. また, 男性話者5名が類似した123都市名を発声したデータを用いてDTW孤立単語認識を行なったところ, 3〜5次元に次元圧縮された中間層の出力を特徴ベクトルとして用いたとき, KL展開による次元圧縮の場合に比べて, 認識率が高かった. 従って, ニューラルネットの非線形性を用いた恒等写像による特徴空間の次元圧縮の効果が確認できた.

収録刊行物

参考文献 (4)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573387452252465536
  • NII論文ID
    110003279652
  • NII書誌ID
    AN10060786
  • ISSN
    09135685
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ