Estimation of parameters of a vocal-tract area function model using 3D MRI movie and recorded speech data
-
- Hirai Hiroyuki
- (株)エーアイ:北陸先端科学技術大学院大学情報科学研究科
-
- Takemoto Hironori
- ATR認知情報科学研究所
-
- Honda Kiyoshi
- LPP, CNRS-U.Paris3:ATR認知情報科学研究所
-
- Dang Jianwu
- 北陸先端科学技術大学院大学情報科学研究科
Bibliographic Information
- Other Title
-
- 3次元MRI動画データと実音声を用いた声道断面積モデルのパラメータ推定
- 3ジゲン MRI ドウガ データ ト ジツオンセイ オ モチイタ セイドウ ダンメンセキ モデル ノ パラメータ スイテイ
Search this article
Abstract
3次元MRI動画と音声を用いて高品質な合成音声の生成を可能にする声道断面積モデルのパラメータ推定手法の提案を行う。始めに,複数話者のMR画像より計測された声道断面積関数を用いて,複数の話者,複数の音素の声道断面積関数を表現できる声道断面積モデルを構築する。次に,単語発声時の3次元MRI動画の声道形状から作成した声道断面積モデルを初期値として,モデルから計算された伝達関数が同じ単語を発声した時の音声のスペクトル包絡と一致するようにシミュレーテッドアニーリングを用いてパラメータの補正を行う。複数の単語に対してパラメータの推定実験を行い,合成音声と実音声とを比較することにより本方式の有効性を確認した。
Journal
-
- THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN
-
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN 64 (4), 216-228, 2008
Acoustical Society of Japan
- Tweet
Details
-
- CRID
- 1390282681543341952
-
- NII Article ID
- 110006655757
-
- NII Book ID
- AN00186234
-
- ISSN
- 24322040
- 03694232
-
- NDL BIB ID
- 9462994
-
- Text Lang
- ja
-
- Data Source
-
- JaLC
- NDL
- CiNii Articles
-
- Abstract License Flag
- Disallowed