ロバストな日本語形態素解析 : 辞書依存性の低いハイブリッドアルゴリズムの提案

Bibliographic Information

Other Title
  • A Hybrid and Robust Algorithm for Segmenting Japanese

Search this article

Description

膠着言語である日本語は単語境界が自明でないため、さまざまなアプリケーションで文章を取り扱う際に、「単語」単位の操作が英語ほどには簡単でなかった。単語の選択・置換・検索といった基本的な操作を可能にし、また更に深い自然言語解析の第一歩とするために、われわれは極めてコンパクトな形態素解析コンポーネント、愛称"T-Hammer"を研究開発した。本稿では、共通コンポーネントとしての T-Hammerの概要、精度、および今後の課題について考察する。現在 T-HammerはWord 97, Encarta, Bookshelf, IISなどの製品に実装されている。

Journal

Details 詳細情報について

Report a problem

Back to top