雑音環境下単語認識のための複素周波数領域における参照再構成法

書誌事項

タイトル別名
  • Referential reconstruction in complex frequency domain for word recognition under noisy environments
  • ザツオン カンキョウカ タンゴ ニンシキ ノ タメノ フクソ シュウハスウ リョウイキ ニ オケル サンショウ サイコウセイホウ

この論文をさがす

抄録

本論文では音声に雑音が重畳した単一チャネルの信号から原音声を復元し,自動音声認識性能を向上させる手法について述べる。著者らはすでに,小規模の音声データベースを事前に用意し,ある尺度で入力フレームと類似しているフレームをデータベース内から抽出し,その抽出したフレームを参考にして出力を得るという手法を提案しているが,本論文では更にその類似尺度と出力方法の改良法を報告する。改良の要点は,短時間フーリエ変換後の位相情報をそのまま保持しておくことと,そこにバイナリマスクをかけることの2点である。性能評価をするために器楽曲雑音及び環境雑音を用いて単語認識実験を行ったところ,低いSNRにおいて単語正解率の改善が見られた。

収録刊行物

  • 日本音響学会誌

    日本音響学会誌 64 (9), 533-544, 2008

    一般社団法人 日本音響学会

参考文献 (19)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ