双方向Transformer言語モデルによる音声認識仮説のリスコアリング

二見, 颯, 上乃, 聖, 三村, 正人, 坂井, 信輔, 河原, 達也

説明

音声認識において、言語モデルを用いてN-best仮説をリスコアリングすることで音声認識性能が改善することが報告されている。近年、自然言語処理の分野では、前後の文脈から単語を補完して推定することができる双方向Transformer言語モデルが様々なタスクにおいて効果を示している。本稿では、双方向Transformer言語モデルを音声認識のリスコアリング手法として適用した。また、この手法を従来行われるN-gram言語モデルやRNN言語モデルによるリスコアリングと比較した。さらに、音声認識仮説の誤り傾向を考慮した双方向Transformer言語モデルの識別学習を提案し、その結果を比較する。

収録刊行物

第82回全国大会講演論文集

第82回全国大会講演論文集 2020 (1), 175-176, 2020-02-20

情報処理学会

詳細情報詳細情報について

CRID: 1050855522065459840

NII論文ID: 170000182276

NII書誌ID: AN00349328

Web Site: https://ipsj.ixsq.nii.ac.jp/records/205207

本文言語コード: ja

資料種別: conference paper

データソース種別

IRDB
CiNii Articles

書き出し

問題の指摘

双方向Transformer言語モデルによる音声認識仮説のリスコアリング

この論文をさがす

説明

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

双方向Transformer言語モデルによる音声認識仮説のリスコアリング

この論文をさがす

説明

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について