Document retrieval based on word's cooccurrences, the algorithum and its application.

Bibliographic Information

Other Title
  • 単語の共起に基づく関連文書検索,算法と検索事例
  • タンゴ ノ キョウキ ニ モトヅク カンレン ブンショ ケンサク サンポウ ト ケンサク ジレイ

Search this article

Abstract

異なった文書に同時に現われる単語に着目することにより,潜在的な意味的検索をおこなうDeerwester(1990)のLatent Semantic Analysisを日本語の比較的大規模な文書集合に対して適用した.その中で,大型疎行列における特異値分解アルゴリズムの比較検討を行ない,日本語文書検索に適した方法を見つけた.これを実際の新聞記事で試し,文書検索,および関連語表示において有効であることの見通しを得た.また実装する上での工夫として,関連文書検索においては,文書の大きさによる基準化が必要なことがわかった.さらに,重複を許す単語のクラスタリングを試みた.

Journal

  • Ouyou toukeigaku

    Ouyou toukeigaku 28 (2), 107-121, 1999

    Japanese Society of Applied Statistics

Citations (3)*help

See more

References(32)*help

See more

Details 詳細情報について

Report a problem

Back to top