Referential reconstruction in complex frequency domain for word recognition under noisy environments

Bibliographic Information

Other Title
  • 雑音環境下単語認識のための複素周波数領域における参照再構成法
  • ザツオン カンキョウカ タンゴ ニンシキ ノ タメノ フクソ シュウハスウ リョウイキ ニ オケル サンショウ サイコウセイホウ

Search this article

Abstract

本論文では音声に雑音が重畳した単一チャネルの信号から原音声を復元し,自動音声認識性能を向上させる手法について述べる。著者らはすでに,小規模の音声データベースを事前に用意し,ある尺度で入力フレームと類似しているフレームをデータベース内から抽出し,その抽出したフレームを参考にして出力を得るという手法を提案しているが,本論文では更にその類似尺度と出力方法の改良法を報告する。改良の要点は,短時間フーリエ変換後の位相情報をそのまま保持しておくことと,そこにバイナリマスクをかけることの2点である。性能評価をするために器楽曲雑音及び環境雑音を用いて単語認識実験を行ったところ,低いSNRにおいて単語正解率の改善が見られた。

Journal

References(19)*help

See more

Details 詳細情報について

Report a problem

Back to top