HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入

吉村, 貴克, 徳田, 恵一, 益子, 貴史, 小林, 隆夫, 北村, 正

書誌事項

タイトル別名

HMM ニモトヅクテキストオンセイゴウセイエノコンゴウレイシンゲンモデルトポストフィルタノドウニュウ
HMM　ニモトズク　テキスト　オンセイ　ゴウセイ　ヘノ　コンゴウ　レイシンゲン　モデル　ト　ポスト　フィルタ　ノ　ドウニュウ
Incorporation of Mixed Excitation Model and Postfilter into HMM-Based Text-to-Speech Synthesis

この論文をさがす

抄録

本論文は，HMMに基づいた音声合成システムに混合励振源モデルを導入することにより，合成音声の品質向上を図ることを目的とする．我々はこれまでに，メルケプストラム，基本周波数，継続長をHMMの枠組みでモデル化し，HMMからこれらの音声パラメータを出力することによって音声を合成するテキスト音声合成システムを提案した．このシステムでは，合成フィルタ（MLSAフィルタ）を励振する際の励振源モデルとして，有声区間，無声区間でそれぞれパルス列と白色雑音を切り換える単純なモデルを用いている．このような励振源を用いる場合，有声摩擦音のように周期成分と非周期成分をともにもつ音声を合成することができず，合成音声の品質を劣化させる原因となる．そこで本論文では，パルス列と白色雑音を混合する混合励振源モデルを用いることにより高品質な音声を実現している狭帯域音声符号化手法MELPの混合励振源モデルを導入する．この混合励振源モデルは，狭帯域音声符号化だけでなく，広帯域音声符号化へも応用されていることから，音声合成においても有効性が期待される．更に，多くの音声符号化手法で用いられているポストフィルタを導入し，合成音声の品質を向上を図る．また主観評価実験により，本システムにおける混合励振源モデルとポストフィルタの有効性を示す．

収録刊行物

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 J87-D2 (8), 1565-1571, 2004-08-01

Institute of Electronics, Information and Communication Engineers

詳細情報詳細情報について

CRID: 1050564287445859968

NII論文ID: 110003171146

NII書誌ID: AA11340957

ISSN: 09151923

NDL書誌ID: 7053153

Web Site: http://id.nii.ac.jp/1476/00005200/; http://id.ndl.go.jp/bib/7053153; https://ndlsearch.ndl.go.jp/books/R000000004-I7053153

本文言語コード: ja

資料種別: journal article

データソース種別

IRDB
NDL
CiNii Articles
KAKEN

HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (4)*注記

参考文献 (9)*注記

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (4)*注記

参考文献 (9)*注記

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について