ダイバー同士の水中会話を支援するための深層学習を用いた音声認識手法

情報処理学会 HANDLE オープンアクセス

抄録

ダイバーが水中でコミュニケーションをとることは,安全面や娯楽面などの観点から重要である.水中における即時性・柔軟性に優れたコミュニケーション方法としては,聴覚を介した音声コミュニケーションが挙げられる.しかし.ダイバーは口にレギュレータを装着しているため,口を正しく動かすことができず,正しい発音で話すことができない.そこで本研究では,水中での円滑な音声コミュニケーションの実現を目指し,レギュレータを口で咥えた状態での不明瞭な音声から音素を認識するシステムを提案する.ダイバー用レギュレータに防水マイクを取り付け,水中での音声を録音し,深層学習を用いて音素の推定を試みた.また,発音の際の口の変化に着目し,ダイバー用レギュレータの上面と左面に圧力センサを設置し,推定精度の向上を試みた.その結果,音声のみを用いたデータの場合の方が推定精度が高かったが,特定の音素においては音声と圧力センサ値の混合データを用いた場合の方が推定精度が優れていることがわかった.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ