音声の線形予測分析
-
- 板倉 文忠
- 名古屋大学 情報メディア教育センター
書誌事項
- タイトル別名
-
- A Tutorial on Linear Predictive Analysis of Speech Signal
この論文をさがす
説明
最尤スペクトル推定法、PARCOR, LSPという音声分析・合成の発展の歴史は、数理的な手法が音声処理に本格的に導入され、成功した例である。これらはいずれも全極形線形モデルを基礎においているが、それぞれに特徴を持っている。LPCは、音声の全極形モデルに基づき、合成フィルターの安定性を保証した分析法である。(自己相関関数の正定値性による)しかしながらLPC係数を低ビット量子化すると、合成フィルタが不安定化する。PARCOR方式は、LPC係数{a i}を{k_i}に変換することにより、この問題を一応解決した。PARCOR方式の最適化に関して、精力的な研究を行った結果、その問題点もいくつか明らかになった。問題点の一つはPARCOR係数は、パラメータの種類により、またパラメータのとる値の組み合わせにより、そのスペクトル感度が大幅に異なることにあった。これらの問題を緩和するために、パラメータ間の不均等ビット割付、パラメータ値に対する非線形量子化等が導入された。さらにPARCOR係数から音声合成するとき、パラメータの線形補間による合成音のスペクトル歪みが大きいという問題もあった。これらがPARCOR方式の低ビット符号化の壁になっていた。こうした問題を解決することを目的として、1975年に線スペクトル分析法が考案された。これを元に、LSP方式が開発され、現在も携帯電話の音声符号化方式にも活用されている。
収録刊行物
-
- 電子情報通信学会技術研究報告. DSP, ディジタル信号処理
-
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 98 (261), 25-32, 1998-09-10
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1571417127416530816
-
- NII論文ID
- 110003279914
-
- NII書誌ID
- AN10060786
-
- ISSN
- 09135685
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles