多様な笑い声生成のための有声音・無声音間隔の制御

この論文をさがす

抄録

笑い声合成は対話システムなどで,より自然な対話の実現に必要なものである.しかし通常の音声合成と異なり,笑い声は陽に音素化できない.先行研究では自己教師あり学習の一種であるHuBERTを用いて笑い声を含む音声波形から離散表現を獲得し,それを通常の音声合成モデルの入力として用いることで笑い声を生成する.本研究では,HuBERTにより獲得された離散表現の分析を行い,また,音声合成モデル内で笑い声のスタイル制御に必要な有声音・無声音の割合を制御することで,多様な笑い声の生成を目指す.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ