音声認識誤りに頑健なニューラル発話意図推定のためのコンフュージョンネットワークの連続表現

DOI

書誌事項

タイトル別名
  • Continuous Representation of Confusion Networks for Neural Spoken Utterance Classification robust to Automatic Speech Recognition Errors

抄録

<p>本稿では,音声認識誤りに頑健な発話意図推定を目指して,音声認識時の複数仮説表現であるコンフュージョンネットワークを直接ニューラルネットワークの枠組みで扱うことが可能なモデル化手法を提案する.提案手法のポイントは,コンフュージョンネットワークを連続表現に変換することであり,その際に注意機構を利用した修正重み付き和表現を用いることで,仮説内の単語の重要性と音声認識時の信頼度を両者を考慮した上で全体最適化を実現する.実験から,提案手法はn-best を用いる方法よりも声認識誤りに頑健に動作することを示す.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390564238002406016
  • NII論文ID
    130007426910
  • DOI
    10.11517/pjsai.jsai2018.0_3g204
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ