スペクトル線形写像による帯域制限音声の広帯域化

Bibliographic Information

Other Title
  • スペクトル センケイ シャゾウ ニ ヨル タイイキ セイゲン オンセイ ノ コウタイイキカ
  • Generation of Broadband Speech from Narrowband Speech Based on Linear Mapping

Search this article

Abstract

本論文では,スペクトル線形写像を用いて帯域制限された音声から広帯域音声を生成する方法について提案している.本方法はLPC分析合成を基本とし,まず入力音声から声道情報(スペクトル包絡)と音源情報(残差波形)を抽出し,声道情報は線形写像により,また音源情報は非線形処理を施すことで広域化する.最後に,この両者からLPC合成により広帯域化音声を作成している.線形写像によるスペクトル包絡の広帯域化は,スペクトル空間をいくつかの部分空間に分割し,各部分空間ごとの変換行列により狭帯域スペクトルから広帯域スペクトルへと変換する.変換行列は,変換後のスペクトルと目標となる広帯域スペクトルとの間に平均2乗誤差を最小化するように学習用音声を用いて推定される.実験では,本手法のほかにコードブック写像及びニューラルネットを用いる方法についてスペクトルひずみに関して比較した結果,線形写像による方法は他の2手法に劣らない性能が得られることが確認できた.また主観評価実験によっても,帯域感を付与する効果が確認できた.

Journal

Citations (1)*help

See more

References(15)*help

See more

Details 詳細情報について

Report a problem

Back to top