書誌事項
- タイトル別名
-
- WWW ケンサク ショリ ノ コウリツカ ノ タメ ノ ベクトル クウカン モデル ノ カイリョウ ト ソノ カクノウ コウゾウ
- Vector-Space Model Modification and its Physical Structure for Improving WWW Search Efficiency
この論文をさがす
説明
インターネットの普及により急激に増大したWWW集合から効率的に必要な情報を取り出す必要性が増している.そこで 膨大に生成・蓄積されたWWW集合から 必要なWWW情報を効率的に取り出すシステムが必要となってきている.この要求を満たすために ベクトル空間モデルに次元数を減少するための改良を加えたモデルを提案する.このモデルを用いて関連性のあるWWW集合をクラスタとしてまとめ 更にその類似度によってページ割り当てを決定する格納構造により 検索処理の効率化を図る.本方法では 格納構造を断層化し この木構造を検索時に辿ることで 必要な情報を格納しているページを容易に決定することができる.また 格納時のオーバーフロー処理についても動的に対応できる方法である.シミュレーションの結果 本方法は 問い合わせに含まれるキーワード数が多い場合の検索や ベクトル全体の関連性の強度が高い情報集合に対する検索に適していることが得られた.
The paper presents new index structure that modifies Vector Space Model, in order to reduce the size of vector space dimension and to improve the number of page access under compression. We intend to develop this model to realize an efficient WWW directory service as a physical structure in searching appropriate page given a set of keywords. The paper describes the basic structure and some algorithms for insertion and searching. In the model, each vector in the vector space is represented only by a list of the keyword number where the document contains the keyword, not by the whole vector elements. The model is also evaluated in the three viewpoints: space efficiency, the number of page accesses for insertion. It is shown from some evaluation that in the model the number of page accesses for searching is almost constant as the number of keywords given varies.
収録刊行物
-
- 情報処理学会論文誌データベース(TOD)
-
情報処理学会論文誌データベース(TOD) 40 (SIG06(TOD3)), 12-21, 1999-08-15
東京 : 情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050564287845394560
-
- NII論文ID
- 10010356671
-
- NII書誌ID
- AA11464847
-
- ISSN
- 18827799
- 03875806
-
- NDL書誌ID
- 5693613
-
- 本文言語コード
- ja
-
- 資料種別
- article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles