- 【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
- Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
- 【Updated on June 30, 2025】Suspension and deletion of data provided by Nikkei BP
- Regarding the recording of “Research Data” and “Evidence Data”
Imaging of Voices and Person Recognition Using the Images
Bibliographic Information
- Other Title
-
- 音声の画像化及びその画像を用いた人物認識
Description
<p> 本研究では,音声の画像化及びその画像を用いた人物認識に関する研究を行う.人物認識システムには,畳み込みニューラルネットワーク(CNN)を用い,音声から生成した画像を学習させる.音声の画像化の方法としては,音の三要素である「音の大きさ」,「音の高さ」,「音色」を,画像のRGBに適用して画像の生成を行う.また,画像化したオリジナルの画像のみでは学習のためのデータが不足するため,回転による画像の拡張(拡張画像)を行いデータの水増しを行う.しかし,卒業研究では,評価に用いたオリジナル画像に対する識別率が期待よりも低くなった.そこで,学習のパラメータの変更や,VGG16を使用した転移学習を行うことで識別率の向上を図る.</p>
Journal
-
- Record of Joint Conference of Electrical and Electronics Engineers in Kyushu
-
Record of Joint Conference of Electrical and Electronics Engineers in Kyushu 2021 (0), 211-212, 2021-09-17
Committee of Joint Conference of Electrical, Electronics and Information Engineers in Kyushu
- Tweet
Details 詳細情報について
-
- CRID
- 1390573407618640256
-
- Text Lang
- ja
-
- Data Source
-
- JaLC
-
- Abstract License Flag
- Disallowed