文字・単語 n-gram の融合に基づく言語モデル

書誌事項

タイトル別名
  • Natural Language Models Based on Combination of Character and Word n-grams

この論文をさがす

説明

べた書きのテキストコーパスから構築することのできる言語モデルとしては、文字を単位としたn-gramモデルが有効であることが知られている。しかし、さらに強い制約を得るためにn-gramの単位を文字から単語に拡張すると、単語境界の曖昧性や少数サンプルの影響が無視できない。本報告では、削除補間法に基づいて単語n-gramモデルを文字n-gramモデルと融合させることにより、これらの問題を解決した言語モデルを提案する。パープレキシティを基準とした評価実験により、提案するモデルが他のモデルに比べ高い曖昧性削減能力を持つことを示す。

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (8)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570009752292553088
  • NII論文ID
    110002934948
  • NII書誌ID
    AN10115061
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ