大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討

Bibliographic Information

Other Title
  • ダイゴイ レンゾク オンセイ ニンシキ ノ タメ ノ オンソ グラフ ニ モトズク カセツ セイゲンホウ ノ ケントウ
  • A Study on a Phoneme -graph- based Hypothesis Restriction for Large Vocabulary Continuous Speech Recognition
  • 大語彙連続音声認識

Search this article

Abstract

本論文では 大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition: LVCSR)のための高速な探索手法について検討し 効果的に探索空間を狭める新しい手法-音素グラフに基づく仮説制限法-を提案する. 本手法は 認識の前処理として音素グラフを生成し 認識段階ではその音素グラフの情報を利用して仮説の展開を制限しながら最良の単語列を探索する. 音素グラフによる仮説制限は 音素境界制限とForward-Backward Pruningからなり これらは探索空間の大幅な削減を可能にする. 語彙サイズ5000の新聞記事読み上げ音声を用いた認識実験において 本手法が誤り率を増加させることなく処理時間の約70%を削減可能であることが示された.

In this paper, we study about fast search strategies for Large Vocabulary Continuous Speech Recognition (LVCSR), and propose a new method - a phoneme-graph-based hypothesis restriction, which effectually prunes the search space. In the proposed method, a phoneme graph is generated at the pre-processing stage, and then the best word sequence is searched while restricting expansion of hypotheses using the information of the phoneme graph at the main recognition stage. The phoneme-graph-based restriction consists of the limitation of phoneme boundaries and the Forward-Back ward Pruning, which enable to reduce the search space dramatically. The proposed method was tested on a 5,000-word Japanese newspaper reading task. The experimental results show that this method can reduce about 70% of the elapsed time without any error increasing.

Journal

Citations (32)*help

See more

References(17)*help

See more

Details 詳細情報について

Report a problem

Back to top