Imaging of Voices and Person Recognition Using the Images

Bibliographic Information

Other Title
  • 音声の画像化及びその画像を用いた人物認識

Description

<p> 本研究では,音声の画像化及びその画像を用いた人物認識に関する研究を行う.人物認識システムには,畳み込みニューラルネットワーク(CNN)を用い,音声から生成した画像を学習させる.音声の画像化の方法としては,音の三要素である「音の大きさ」,「音の高さ」,「音色」を,画像のRGBに適用して画像の生成を行う.また,画像化したオリジナルの画像のみでは学習のためのデータが不足するため,回転による画像の拡張(拡張画像)を行いデータの水増しを行う.しかし,卒業研究では,評価に用いたオリジナル画像に対する識別率が期待よりも低くなった.そこで,学習のパラメータの変更や,VGG16を使用した転移学習を行うことで識別率の向上を図る.</p>

Journal

Details 詳細情報について

Report a problem

Back to top