言葉の関連性による文書の類似検索  小倉百人一首を分類・分析する

書誌事項

タイトル別名
  • A method of similary retrieval by using knowledge base of word relations. To classificate "100 poems by 10 poets".
  • コトバ ノ カンレンセイニヨルブンショ ノ ルイジ ケンサク オグラ ヒャクニ
  • -To classificate"100 poems by 100 poets"-
  • ―小倉百人一首を分類・分析する―

この論文をさがす

説明

類似検索や概念検索の基本的な手法は,語の出現頻度や文書を構成する単語間の相関関係を解析し,内容の類似性を判断して目的の文書を探し出す。「親近性尺度による単語の距離」,「近接的共起発生による単語の類似度」,「検索語に対する文書の重要度」,「検索文書の適合度と文書間の類似度」の四つの類似検索技術を「百人一首」に適用し,評価する。類似検索の手法は,同義語やシソーラスによる知的検索に近く,知識辞書や概念辞書の自動構築と精度向上が課題となる。また,文書検索における適合性や類似性は,検索者の検索目的や価値観により異なるため,検索結果の関連度や類似度の判断材料と判断理由の説明が重要となる。

収録刊行物

  • 情報管理

    情報管理 41 (7), 517-528, 1998

    国立研究開発法人 科学技術振興機構

被引用文献 (1)*注記

もっと見る

参考文献 (2)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ