構造化文書とデータベースの統合利用 : 異種情報表現の相互変換メカニズムとその応用
書誌事項
- タイトル別名
-
- A Conversion Mechanism for Structured Documents and Databases and its Application
この論文をさがす
説明
近年, ネットワークの普及に従って異種分散情報資源が容易に利用可能となり, それらの統合利用が重要な課題となっている. 我々は, 構造化文書とリレーショナルデータベースを対象とした, 統合利用環境の研究開発を行なっている. この統合利用環境(図1)では, まず, ラッパーが各情報資源中のデータを統合データモデルであるNR/SD モデルに変換し, メディエータが NR/SD モデルに基づいた統合操作の機構を提供する. [figure] NR/SD モデルは, 入れ子型リレーショナルモデルに, 構造化文書を扱うための抽象データ型 "構造化文書型" (SD 型) を導入したものである. NR/SD モデルの最大の特徴は, 構造化文書と入れ子型リレーション構造を, 動的かつ部分的に相互変換するためのオペレータ "コンバータ" (converter) にある. NR/SD モデルを利用することにより, 次のような応用が可能になる. (1)入れ子型リレーショナル代数系を利用して, 構造化文書群の操作を行なう. (2)入れ子型リレーション構造を構造化文書に変換することにより, 型と独立した検索やメタデータを手がかりとした検索を行なう. さらに, 部分的に変換を行なうことにより, 構造の異なるデータを適当な抽象度で抽象化し統一的に操作することができるので,構造化文書とデータベースという表現の異種性に加え, データ構造の異種性にも対処可能である. これは, 構造化文書のような準構造化データの操作に特に有効であると考えられる. これらの他にも, WWW のような環境において, データベース検索の結果を構造化文書の形式で求めたり, 構造化文書に対するビューを定義する, といったことも可能である. しかし, 従来の NR/SD モデルは以下のような点で制限があった. (1) SD 型で許される文書構造の制約が厳しく, SGML 文書等に現れる例外構造や再帰構造等に直接対応していない. (2) SGML 文書等に現れる, 要素に付随する属性の操作を考慮していない. (3)コンバータによる変換の対象となる, 入れ子型リレーション構造と構造化文書の構造の関係に制約があり, 任意の変換を行なうためには, コンバータ以外の演算も含めた複数の演算を,データ構造に従って複雑に組み合わせ適用する必要がある. 本稿では, NR/SD モデルを改良しこれらの問題点を解決したモデルとその応用例を示す. 特に, 入れ子型リレーション構造と構造化文書を相互変換するコンバータの改良を中心に説明する.
収録刊行物
-
- 全国大会講演論文集
-
全国大会講演論文集 第54回 (データベースとメディア), 197-198, 1997-03-12
情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050574047110939904
-
- NII書誌ID
- AN00349328
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB