An automatic indexing of compound words based on mutual information for Korean text retrieval

DOI

抄録

最近,自然語テキスト表現に対する索引語として単語と複合語が広く利用されてきている。本稿では,膠着語,特に韓国語に適した複合語の自動索引手法を提案している。まず,索引語としての複合語を組み立てるための条件を述べ,次に,テキスト全体から連続する名詞群に適用できる分解規則を示した。最後に,情報理論に基づき複合語における語の連合の程度を算出する,語の利用可能性を測定する一つの尺度として相互情報を提案した。この方法を当てはめた結果,複合語の語の精度は72%から87%に向上した。

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390011240737004160
  • DOI
    10.46895/lis.34.29
  • ISSN
    03734447
  • データソース種別
    • JaLC
    • Crossref
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ