WWW検索処理の効率化のためのベクトル空間モデルの改良とその格納構造

Bibliographic Information

Other Title
  • WWW ケンサク ショリ ノ コウリツカ ノ タメ ノ ベクトル クウカン モデル ノ カイリョウ ト ソノ カクノウ コウゾウ
  • Vector-Space Model Modification and its Physical Structure for Improving WWW Search Efficiency

Search this article

Description

インターネットの普及により急激に増大したWWW集合から効率的に必要な情報を取り出す必要性が増している.そこで 膨大に生成・蓄積されたWWW集合から 必要なWWW情報を効率的に取り出すシステムが必要となってきている.この要求を満たすために ベクトル空間モデルに次元数を減少するための改良を加えたモデルを提案する.このモデルを用いて関連性のあるWWW集合をクラスタとしてまとめ 更にその類似度によってページ割り当てを決定する格納構造により 検索処理の効率化を図る.本方法では 格納構造を断層化し この木構造を検索時に辿ることで 必要な情報を格納しているページを容易に決定することができる.また 格納時のオーバーフロー処理についても動的に対応できる方法である.シミュレーションの結果 本方法は 問い合わせに含まれるキーワード数が多い場合の検索や ベクトル全体の関連性の強度が高い情報集合に対する検索に適していることが得られた.

The paper presents new index structure that modifies Vector Space Model, in order to reduce the size of vector space dimension and to improve the number of page access under compression. We intend to develop this model to realize an efficient WWW directory service as a physical structure in searching appropriate page given a set of keywords. The paper describes the basic structure and some algorithms for insertion and searching. In the model, each vector in the vector space is represented only by a list of the keyword number where the document contains the keyword, not by the whole vector elements. The model is also evaluated in the three viewpoints: space efficiency, the number of page accesses for insertion. It is shown from some evaluation that in the model the number of page accesses for searching is almost constant as the number of keywords given varies.

Journal

References(6)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top