情報検索技術を用いたXML部分文書の検索手法

書誌事項

タイトル別名
  • ジョウホウ ケンサク ギジュツ オ モチイタ XML ブブン ブンショ ノ ケンサク シュホウ
  • A Retrieval Method for XML Subdocuments Based on Information Retrieval Techniques

この論文をさがす

抄録

インターネット上でデータ交換やデータの配布が行われるようになり,ネットワーク上における構造化文書の利用に注目が集まっている.XML はネットワーク上におけるデータ交換の標準フォーマットとなりつつあり,我々はXML を利用することで様々な文書を効率良く記述し,ネットワーク上を流通させることができる.しかし,XML 文書の検索手法としてこれまで提案されてきた手法は,XML 問合せ言語を用いた文書の論理構造を意識した方法もしくはデータベースに格納後SQL を用いた方法であり,情報検索技術を用いた手法は数少ない.そこで本論文では,XML 文書の検索に情報検索技術を用いた新しい検索手法の提案を行い,利用者がXML 文書の構造を意識せずに問合せができ,その問合せを受けた検索システムが文書構造と利用者の問合せの内容を考慮することで,利用者の問合せに合致したXML 部分文書を検索することができるシステムの実現を目指す.また,実際に検索システムの実装を行い,その有効性の検証を行う.

As XML is becoming as the standard format for data exchange on the Internet, the use of structured documents draws a greater deal of attention. Techniques for retrieval of strucrued documents can be classified into two categories --- database-based approach and IR-based approach. Until now, much attention has been paid on the database-based approaches such as XPath and XQuery. However, IR-based retrieval techniques for structured documents are not matured enough. In this paper, we propose a new retrieval technique for XML documents based on IR-based retrieval technique. With our technique, users can extract partial documents relevant to users' query without knowing the structure of the documents. Furthermore, we examined the difference of the accuracy between the present techniques and the technique we are proposing and verify the validity of our proposed technique.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (31)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ