多言語音声の同時認識システムにおける翻訳モデルとスコア計算の高速化

書誌事項

タイトル別名
  • タゲンゴ オンセイ ノ ドウジ ニンシキ システム ニ オケル ホンヤク モデル ト スコア ケイサン ノ コウソクカ
  • A Study of Translation Models and Score Calculation on Bilingual ASR Framework

この論文をさがす

抄録

国際会議やニュースでは,複数の言語で同一内容の発話がなされていることが多い.我々は,これまでにこのような多言語音声の音声認識の枠組み,具体的には,ある言語の音声とそれに対応する他言語の音声を,翻訳モデル(TM)を用いてお互いに情報を補い,同時に認識する枠組みを提案している.本論文では,多言語音声の同時認識システムにおけるTMモデル化手法およびTMスコア計算の高速化について研究を行った.IBMモデル1,モデル2およびモデル3のすべてについて,多言語音声の同時認識用のTMとして有効であることを明らかにした.ドメインの一致するコーパスを大量に用いて学習することの重要性を確認した.TMスコア計算では,スコア近似手法を提案し,音声認識精度の性能低下を抑えつつ高速化が行えることを示した.

This paper addresses automatic speech recognition (ASR) for multilingual audio contents. Conventionally, ASR has been performed independently, namely, language by language, although multilingual speech, which consists of utterances in several languages representing identical meaning, is available. We previously proposed a bilingual ASR framework based on statistical ASR and machine translation in which bilingual ASR is performed simultaneously and complementarily. In this simultaneous recognition framework, ASR systems use not only acoustic and language model scores but also a translation model (TM) score. In this study, we investigate a suitable TM modeling and an efficient calculation method of TM scores. We compared several TM models, which are trained with matched/unmatched domain corpus, and TM score calculation methods. We confirmed the effectiveness of IBM model-1, model-2 and model-3 based TMs and the significance of TM training with large amount of matched domain corpus. We significantly reduced processing time for TM score calculation without any degradation of ASR accuracy.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ