ニューラルネットワークを用いた会話音声の感情推定

DOI

書誌事項

タイトル別名
  • Estimation of Emotional Speech with Neural Network

抄録

<p>通信技術の発達した現代では電話越しなど、視覚情報のない状況下でコミュニケーションをとる機会が多い。そのような状況で相手の感情を推定することは非常に重要であり、会話音声から感情を推定するサービスも開発されているが、識別できる感情の種類が少ないなどの問題が挙げられる。本研究では、音声信号を短時間フーリエ変換によりスペクトログラムに変換し,Convolutional Neural Network(CNN)を用いて感情を9種類に識別する手法を提案した。異なる構造のCNNを比較し、感情認識に適したCNN構造を見つけ出した。また、Grad-CAMを用いてCNNの畳み込み層の勾配を取得してCNNの判断根拠を可視化することで、CNNが音声の抑揚から感情を認識していることが明らかになった。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390565134817641344
  • NII論文ID
    130007788212
  • DOI
    10.11527/jceeek.2019.0_286
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ