自然で表現豊かな笑い声合成に向けた感情情報からの笑い声の構成要素決定法

DOI 情報処理学会 オープンアクセス

書誌事項

タイトル別名
  • Laughter Components Estimation Using Emotional Information towards Natural and Expressive Laughter Synthesis

この論文をさがす

抄録

自然で表現豊かな笑い声合成の実現のために,その入力情報となる笑い声の構成要素を決定する方法を提案する.従来手法では,笑い声を合成する際に入力する笑い声の構成要素の並びを人手により指定する必要があった.また,入力とする笑い声の構成要素を記述するためには音響音声学的知識が不可欠であるため,ユーザが直感的に入力情報を記述することは困難である.本研究では,より直感的な操作による自然で表現豊かな笑い声合成の実現に向けて,入力情報となる笑い声の構成要素の並びをその感情情報を利用して決定する手法について提案する.まずは,構成要素と感情情報との関係を明らかにするため,笑い声を構成する無声呼気・有声呼気・無声吸気・有声吸気の各音響イベント間で聴取実験により付与された感情3次元(快-不快,覚醒-睡眠,支配-服従)に差があるか検証した.その結果,いずれの感情次元においても,構成要素間に有意な差が認められた.さらに,提案手法を用いて入力となる構成要素列を決定した笑い声を合成し,その自然性と感情知覚を評価する聴取実験を行った.その結果,提案手法を用いて笑い声の構成要素を自動決定しても,自然性を損なうことなく,感情知覚させることのできる笑い声の合成が可能であることを示した.

Towards natural and expressive laughter synthesis, a determination method of the laughter components is proposed for automatically creating input information for laughter synthesis system. The conventional laughter synthesis requires manual arrangement of laughter components when synthesizing laughter. In addition, it is difficult for end-users to intuitively arrange them to synthesize laughters because acoustic and phonetic knowledge should be required to arrange its complicated structure of laughter components. To synthesize natural and expressive laughters by more intuitive operation, this study proposes a method to determine the sequence of laughter components as the input information using the emotional information. First, to clarify the relationship between each laughter component (unvoiced exhalation, voiced exhalation, unvoiced inhalation, and voiced inhalation) and emotional information, statistical tests were performed on the factor of laughter component using the perception scores on three emotional dimensions (pleasantness, arousal, and dominance). The result revealed the significant differences between the four components for all emotional dimensions. Furthermore, a listening test was conducted to evaluate the naturalness and emotional perception of synthesizing laughter using the input component sequence determined by the proposed method. As a result, it was found that the synthesized laughter using our approach is emotionally perceivable without losing its naturalness.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ