Referential reconstruction in complex frequency domain for word recognition under noisy environments
-
- Ihara Takehiro
- 電気通信大学情報工学専攻
-
- Takagi Kazuyuki
- 電気通信大学情報工学専攻
-
- Ozeki Kazuhiko
- 電気通信大学情報工学専攻
Bibliographic Information
- Other Title
-
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- ザツオン カンキョウカ タンゴ ニンシキ ノ タメノ フクソ シュウハスウ リョウイキ ニ オケル サンショウ サイコウセイホウ
Search this article
Abstract
本論文では音声に雑音が重畳した単一チャネルの信号から原音声を復元し,自動音声認識性能を向上させる手法について述べる。著者らはすでに,小規模の音声データベースを事前に用意し,ある尺度で入力フレームと類似しているフレームをデータベース内から抽出し,その抽出したフレームを参考にして出力を得るという手法を提案しているが,本論文では更にその類似尺度と出力方法の改良法を報告する。改良の要点は,短時間フーリエ変換後の位相情報をそのまま保持しておくことと,そこにバイナリマスクをかけることの2点である。性能評価をするために器楽曲雑音及び環境雑音を用いて単語認識実験を行ったところ,低いSNRにおいて単語正解率の改善が見られた。
Journal
-
- THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN
-
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN 64 (9), 533-544, 2008
Acoustical Society of Japan
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1390282681543129344
-
- NII Article ID
- 110006873894
-
- NII Book ID
- AN00186234
-
- ISSN
- 24322040
- 03694232
-
- NDL BIB ID
- 9649121
-
- Text Lang
- ja
-
- Data Source
-
- JaLC
- NDL
- CiNii Articles
-
- Abstract License Flag
- Disallowed