双方向Transformer言語モデルによる音声認識仮説のリスコアリング

二見, 颯, 上乃, 聖, 三村, 正人, 坂井, 信輔, 河原, 達也

Description

音声認識において、言語モデルを用いてN-best仮説をリスコアリングすることで音声認識性能が改善することが報告されている。近年、自然言語処理の分野では、前後の文脈から単語を補完して推定することができる双方向Transformer言語モデルが様々なタスクにおいて効果を示している。本稿では、双方向Transformer言語モデルを音声認識のリスコアリング手法として適用した。また、この手法を従来行われるN-gram言語モデルやRNN言語モデルによるリスコアリングと比較した。さらに、音声認識仮説の誤り傾向を考慮した双方向Transformer言語モデルの識別学習を提案し、その結果を比較する。

Journal

第82回全国大会講演論文集

第82回全国大会講演論文集 2020 (1), 175-176, 2020-02-20

情報処理学会

Details 詳細情報について

CRID: 1050855522065459840

NII Article ID: 170000182276

NII Book ID: AN00349328

Web Site: https://ipsj.ixsq.nii.ac.jp/records/205207

Text Lang: ja

Article Type: conference paper

Data Source

IRDB
CiNii Articles

Export

Report a problem