音声の線形予測分析

書誌事項

タイトル別名
  • A Tutorial on Linear Predictive Analysis of Speech Signal

この論文をさがす

説明

最尤スペクトル推定法、PARCOR, LSPという音声分析・合成の発展の歴史は、数理的な手法が音声処理に本格的に導入され、成功した例である。これらはいずれも全極形線形モデルを基礎においているが、それぞれに特徴を持っている。LPCは、音声の全極形モデルに基づき、合成フィルターの安定性を保証した分析法である。(自己相関関数の正定値性による)しかしながらLPC係数を低ビット量子化すると、合成フィルタが不安定化する。PARCOR方式は、LPC係数{a i}を{k_i}に変換することにより、この問題を一応解決した。PARCOR方式の最適化に関して、精力的な研究を行った結果、その問題点もいくつか明らかになった。問題点の一つはPARCOR係数は、パラメータの種類により、またパラメータのとる値の組み合わせにより、そのスペクトル感度が大幅に異なることにあった。これらの問題を緩和するために、パラメータ間の不均等ビット割付、パラメータ値に対する非線形量子化等が導入された。さらにPARCOR係数から音声合成するとき、パラメータの線形補間による合成音のスペクトル歪みが大きいという問題もあった。これらがPARCOR方式の低ビット符号化の壁になっていた。こうした問題を解決することを目的として、1975年に線スペクトル分析法が考案された。これを元に、LSP方式が開発され、現在も携帯電話の音声符号化方式にも活用されている。

収録刊行物

参考文献 (4)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571417127416530816
  • NII論文ID
    110003279914
  • NII書誌ID
    AN10060786
  • ISSN
    09135685
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ