Estimation of Emotional Speech with Neural Network

DOI

Bibliographic Information

Other Title
  • ニューラルネットワークを用いた会話音声の感情推定

Abstract

<p>通信技術の発達した現代では電話越しなど、視覚情報のない状況下でコミュニケーションをとる機会が多い。そのような状況で相手の感情を推定することは非常に重要であり、会話音声から感情を推定するサービスも開発されているが、識別できる感情の種類が少ないなどの問題が挙げられる。本研究では、音声信号を短時間フーリエ変換によりスペクトログラムに変換し,Convolutional Neural Network(CNN)を用いて感情を9種類に識別する手法を提案した。異なる構造のCNNを比較し、感情認識に適したCNN構造を見つけ出した。また、Grad-CAMを用いてCNNの畳み込み層の勾配を取得してCNNの判断根拠を可視化することで、CNNが音声の抑揚から感情を認識していることが明らかになった。</p>

Journal

Details 詳細情報について

  • CRID
    1390565134817641344
  • NII Article ID
    130007788212
  • DOI
    10.11527/jceeek.2019.0_286
  • Text Lang
    ja
  • Data Source
    • JaLC
    • CiNii Articles
  • Abstract License Flag
    Disallowed

Report a problem

Back to top