音声の画像化及びその画像を用いた人物認識

津曲 駿輝, 竹崎 隼平, 岸田 一也

doi:10.11527/jceeek.2021.0_211

書誌事項

タイトル別名

Imaging of Voices and Person Recognition Using the Images

説明

<p>　本研究では，音声の画像化及びその画像を用いた人物認識に関する研究を行う．人物認識システムには，畳み込みニューラルネットワーク（CNN）を用い，音声から生成した画像を学習させる．音声の画像化の方法としては，音の三要素である「音の大きさ」，「音の高さ」，「音色」を，画像のRGBに適用して画像の生成を行う．また，画像化したオリジナルの画像のみでは学習のためのデータが不足するため，回転による画像の拡張（拡張画像）を行いデータの水増しを行う．しかし，卒業研究では，評価に用いたオリジナル画像に対する識別率が期待よりも低くなった．そこで，学習のパラメータの変更や，VGG16を使用した転移学習を行うことで識別率の向上を図る．</p>

収録刊行物

電気関係学会九州支部連合大会講演論文集

電気関係学会九州支部連合大会講演論文集 2021 (0), 211-212, 2021-09-17

電気・情報関係学会九州支部連合大会委員会

詳細情報詳細情報について

CRID: 1390573407618640256

DOI: 10.11527/jceeek.2021.0_211

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘