XML文書に対する構造を指定した全文検索方式の提案

書誌事項

タイトル別名
  • XML ブンショ ニ タイスル コウゾウ オ シテイ シタ ゼンブン ケンサク ホウシキ ノ テイアン
  • A Proposal of a Full-text Search Method for XML Documents Using Their Structures
  • 情報検索

この論文をさがす

抄録

近年,蓄積されたXML文書に対して柔軟に構造を指定できる全文検索システムが必要とされている.本論文は,XML文書に対する構造を指定した全文検索方式を提案する.提案手法は,指定された構造の部分文書検索にはストロングDATAGUIDEおよび範囲ラベルを用い,全文検索にはテキストインデックスを用いる.提案手法では,テキストインデックスを拡張してdgノードIDと範囲ラベルを付与することで不必要な構造ジョインを回避している.これにより,XML文書から検索ワードを含むXML部分文書を柔軟かつ高速に検索することができる.本論文では,提案手法を,柔軟な検索を犠牲にした高速な部分インデックス手法と,検索単語とマッチした全テキストノードをそのまま構造ジョインする単純組合せ手法と比較して評価を行った.評価実験では,部分インデックス手法より9%以下の速度低下で柔軟な検索を実現し,単純組合せ手法より最大1桁以上の高速化を確認できた.

Recently, a full text search system for stored XML documents using their structures flexibly is needed. In this paper, we propose a full text search method for XML documents using their structures. Our approach uses strong DATAGUIDE and range label for searching partial XML documents, and text index for a full text search. Our approach avoids structural join by giving a dg node and a range label to the text index. Our approach can search the partial XML documents including the search word flexibly and at high speed. In this paper, we compare our method with a partial index method and a naive method. Our experimental evaluation shows that the proposed technique has flexibility and efficiency.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ