砂時計型ニューラルネットワークの多段化によるLSPパラメータ圧縮特性の改善

書誌事項

タイトル別名
  • スナドケイガタ ニューラル ネットワーク ノ タダンカ ニ ヨル LSP パラメータ アッシュク トクセイ ノ カイゼン
  • Improvement of Compression Characteristic of LSP Parameters by Cascading Sandglass Type Neural Network
  • 音声言語

この論文をさがす

抄録

我々は,多段接続5 層砂時計型ニューラルネットワーク(CSNN(NL5))を用いた日本語5母音のLSPパラメータの情報圧縮と特徴抽出を行う手法を提案した.男性話者1名による日本語5母音の発話資料を用いてCSNN(NL5) の有効性を実証した.これにより,1) CSNN(NL5) により2次に圧縮されたパラメータの分布は,第1,第2フォルマントの分布と類似した分布を示すこと,2) CSNN(NL5) は,圧縮したLSPパラメータを音声合成に使用できる精度で復元できることを明らかにした.

We proposed a new scheme that derives the characteristics of Japanese five vowels out of LSP parameters by compressing information in terms of cascaded five-layer-sandglass-type neural network (CSNN(NL5)). We have verified the ability of CSNN(NL5) by using five vowels pronounced by a male speaker . The followings were clarified, 1) the distribution of LSP parameters compressed by CSNN(NL5) is similar to the distribution of F1-F2 formants, 2) CSNN(NL5) can reproduce the LSP parameters from the compressed parameters usable for speech synthesis.

収録刊行物

参考文献 (4)*注記

もっと見る

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ