構造データ集合からなるグラフデータベースからの頻出パターン発見

Bibliographic Information

Other Title
  • コウゾウ データ シュウゴウ カラ ナル グラフデータベース カラ ノ ヒンシュツ パターン ハッケン
  • Discovery of Frequent Patterns in Multi-structured Graph Databases

Search this article

Description

本稿では,生物情報学における代謝パスウェイや社会ネットワークなどに対するより詳細な分析手段を提供することを目的に,各頂点にアイテム集合や系列などの構造データの集合を持つ複雑なグラフデータベース,すなわち複合構造グラフデータベースを対象とした頻出パターン発見手法を提案する.また,得られるパターン数の増大という頻出パターン発見における問題に対処するため,パターン中の各頂点を,利用者による制約を満たしかつ代表的なものに限定する枝刈り手法を導入する.実データを用いた実験により,既存研究では発見できなかったパターンを発見できることを確認した.

In this paper, as one of the tools for precise analysis of complex networks such as metabolic pathways in bioinformatics and social networks, we propose an algorithm for mining frequent patterns in multi-structured graph databases in which each vertex consists of a set of structured data such as item sets and sequences. Furthermore, we also propose two pruning mechanisms to exclude uninteresting patterns to alleviate the problem that huge number of patterns will be discovered. The effectiveness of the proposed algorithms is confirmed through the experiments with two real datasets. In addition, the proposed algorithms succeeded in finding some patterns which were not discovered by conventional graph miners.

Journal

Related Projects

See more

Keywords

Details 詳細情報について

Report a problem

Back to top