書誌事項
- タイトル別名
-
- HMM ニ モトヅク テキスト オンセイ ゴウセイ エ ノ コンゴウレイシンゲン モデル ト ポストフィルタ ノ ドウニュウ
- HMM ニモトズク テキスト オンセイ ゴウセイ ヘノ コンゴウ レイシンゲン モデル ト ポスト フィルタ ノ ドウニュウ
- Incorporation of Mixed Excitation Model and Postfilter into HMM-Based Text-to-Speech Synthesis
この論文をさがす
抄録
本論文は,HMMに基づいた音声合成システムに混合励振源モデルを導入することにより,合成音声の品質向上を図ることを目的とする.我々はこれまでに,メルケプストラム,基本周波数,継続長をHMMの枠組みでモデル化し,HMMからこれらの音声パラメータを出力することによって音声を合成するテキスト音声合成システムを提案した.このシステムでは,合成フィルタ(MLSAフィルタ)を励振する際の励振源モデルとして,有声区間,無声区間でそれぞれパルス列と白色雑音を切り換える単純なモデルを用いている.このような励振源を用いる場合,有声摩擦音のように周期成分と非周期成分をともにもつ音声を合成することができず,合成音声の品質を劣化させる原因となる.そこで本論文では,パルス列と白色雑音を混合する混合励振源モデルを用いることにより高品質な音声を実現している狭帯域音声符号化手法MELPの混合励振源モデルを導入する.この混合励振源モデルは,狭帯域音声符号化だけでなく,広帯域音声符号化へも応用されていることから,音声合成においても有効性が期待される.更に,多くの音声符号化手法で用いられているポストフィルタを導入し,合成音声の品質を向上を図る.また主観評価実験により,本システムにおける混合励振源モデルとポストフィルタの有効性を示す.
収録刊行物
-
- 電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理
-
電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 J87-D2 (8), 1565-1571, 2004-08-01
Institute of Electronics, Information and Communication Engineers
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050564287445859968
-
- NII論文ID
- 110003171146
-
- NII書誌ID
- AA11340957
-
- ISSN
- 09151923
-
- NDL書誌ID
- 7053153
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles
- KAKEN