HMMに基づいた極低ビットレート音声符号化

書誌事項

タイトル別名
  • HMM ニ モトヅイタ ゴク テイ ビット レート オンセイ フゴウカ
  • HMM ニモトズイタ キョクテイ ビットレート オンセイ フゴウカ
  • Very Low Bit Rate Speech Coding Based on HMMs

この論文をさがす

説明

本文ではHMM(Hidden Markov Model)に基づく極低ビットレート音声符号化について述べている. 符号化器側では, HMMによる音素認識を行い, 復号化器に音素インデックス列, 状態継続長, ピッチ情報を伝送する. 復号化器側では, 音素インデックス列に従い音素HMMを連結する. そして, 連結したHMMから, 状態継続長に従って, ゆう度最大化基準による音声パラメータ生成アルゴリズムにより, メルケプストラム列を生成する. 最後に, 生成されたメルケプストラムを係数としてもつMLSA(Mel Log Spectrum Approximation)フィルタを, ピッチ情報に従って励振することによって合成音声を得る. 主観評価実験の結果, ピッチ情報を除いて146 bit/s(26%の無音区間を含む)の提案方式により, 同じくピッチ情報を除いて400 bit/s(8 bit/frame × 50 frame/s)の ベクトル量子化に基づくボコーダと同等の性能を得ることができた.

収録刊行物

被引用文献 (7)*注記

もっと見る

参考文献 (23)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ