Automatic Segmentation for Transformation of Kana into Kanji

Bibliographic Information

Other Title
  • べた書き文の分かち書きと仮名漢字変換 -ニ文節最長一致法による分かち書き-

Search this article

Description

べた書き文からの漢字変換を行ううえで必要となる自動分かち書きの方法を提案し それらを用いた仮名漢字変換システムについて述べる.本システムの実用上の目的は漢字入力を容易に行えるようにすることにあり 打鍵者に課する負担を小さくするために 入力仮名文として 分かち書き用の制御信号などを入れない いわゆるべた書き文を採用した.べた書き文から漢字仮名混り文への変換過程で必要となる分かち書き方法として 二文節最長一致法を用いている.二文節最長一致法とは連続する二文節と見なし得る文字列の長さを尺度として 文節分かち書きを行っていく方法である.また 付属語による分かち書きを用いて 未登録語(辞書中に存在しない語)の出現に対しても 分かち書きを可能としている.これらの分かち書き法を基本とするべた書き文の仮名漢字変換システムを構成し 実験を行った.雑誌などからの214文(総文節数2592でその4%程度の文節に未登録語を含む)を対象とした実験では 97.2%の文節が正しく分かち書きされており 本論の提案する分かち書き方法が有効であることを示した.

Journal

Citations (21)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top