音声の画像化及びその画像を用いた人物認識

書誌事項

タイトル別名
  • Imaging of Voices and Person Recognition Using the Images

説明

<p> 本研究では,音声の画像化及びその画像を用いた人物認識に関する研究を行う.人物認識システムには,畳み込みニューラルネットワーク(CNN)を用い,音声から生成した画像を学習させる.音声の画像化の方法としては,音の三要素である「音の大きさ」,「音の高さ」,「音色」を,画像のRGBに適用して画像の生成を行う.また,画像化したオリジナルの画像のみでは学習のためのデータが不足するため,回転による画像の拡張(拡張画像)を行いデータの水増しを行う.しかし,卒業研究では,評価に用いたオリジナル画像に対する識別率が期待よりも低くなった.そこで,学習のパラメータの変更や,VGG16を使用した転移学習を行うことで識別率の向上を図る.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390573407618640256
  • DOI
    10.11527/jceeek.2021.0_211
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ