HTML文書構造を利用したWeb検索結果クラスタリング手法の有効性について

この論文をさがす

抄録

自分が知らない単語の語義を調べる際に用いる国語辞典などには新出単語や専門用語が収録されていないことが多い.だが,Webではそういった情報でも多く流通しているため,検索エンジンを用いた調査は日常化している.しかし,個人からの情報発信が容易になりWebが肥大化しているため,目的とする情報に到達することが困難になってきている.本研究では,X-means法によるハードクラスタリングを行い,Webページ内のリンク数やHTML構造を利用することにより,対象とする検索単語についてスニペットを自動生成することで,情報検索効率を向上させることを目的としている.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ