An automatic indexing of compound words based on mutual information for Korean text retrieval
説明
最近,自然語テキスト表現に対する索引語として単語と複合語が広く利用されてきている。本稿では,膠着語,特に韓国語に適した複合語の自動索引手法を提案している。まず,索引語としての複合語を組み立てるための条件を述べ,次に,テキスト全体から連続する名詞群に適用できる分解規則を示した。最後に,情報理論に基づき複合語における語の連合の程度を算出する,語の利用可能性を測定する一つの尺度として相互情報を提案した。この方法を当てはめた結果,複合語の語の精度は72%から87%に向上した。
収録刊行物
-
- Library and Information Science
-
Library and Information Science 34 29-38, 1997-03-31
三田図書館・情報学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390011240737004160
-
- ISSN
- 03734447
-
- データソース種別
-
- JaLC
- Crossref
-
- 抄録ライセンスフラグ
- 使用不可