自動パターン検出のためのストリームアルゴリズム

Bibliographic Information

Other Title
  • An Online Algorithm for Mining Data Streams

Search this article

Description

本論文では,時系列データストリームを対象とした自動特徴抽出手法であるStreamScopeについて述べる.StreamScopeはIoTアプリケーションやWebアクセス履歴等の大規模なデータストリームから,(a)自動的に時系列パターンを発見し,(b)それらの特徴を統計的に要約しながら,データストリームを構成するすべてのパターンを明らかにする.また,(c)計算時間はデータストリームの長さに依存せず,ストリームマイニングに適した高速な処理を行う.実データを用いた実験では,提案手法がデータストリームに含まれる特徴的なパターンの種類と変化点を自動的かつ正確にとらえることを確認した.さらに,提案手法はオンライン処理でありながら高精度であり,計算時間について大幅な性能向上を達成していることを明らかにした.

In this paper, we propose a streaming algorithm, namely StreamScope, that is designed to find important patterns efficiently from data streams. Our proposed method has the following properties: (a) it is effective: it operates on semi-infinite collections of co-evolving streams and summarizes all the streams into a set of multiple discrete segments that agree with human intuition; (b) it is automatic: it incrementally and automatically recognizes such patterns and generates models for each of them if necessary; (c) it is scalable: the time complexity of our method does not depend on the length of the data streams. Our extensive experiments on real datasets demonstrate that StreamScope can find meaningful patterns and achieve great improvement in terms of computational time over its full batch method competitors.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top