書誌事項
- タイトル別名
-
- Natural Language Models Based on Combination of Character and Word n-grams
この論文をさがす
説明
べた書きのテキストコーパスから構築することのできる言語モデルとしては、文字を単位としたn-gramモデルが有効であることが知られている。しかし、さらに強い制約を得るためにn-gramの単位を文字から単語に拡張すると、単語境界の曖昧性や少数サンプルの影響が無視できない。本報告では、削除補間法に基づいて単語n-gramモデルを文字n-gramモデルと融合させることにより、これらの問題を解決した言語モデルを提案する。パープレキシティを基準とした評価実験により、提案するモデルが他のモデルに比べ高い曖昧性削減能力を持つことを示す。
収録刊行物
-
- 情報処理学会研究報告. NL,自然言語処理研究会報告
-
情報処理学会研究報告. NL,自然言語処理研究会報告 114 109-114, 1996-07-18
一般社団法人情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1570009752292553088
-
- NII論文ID
- 110002934948
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles