大規模時系列データの特徴自動抽出

IPSJ Open Access

Bibliographic Information

Other Title
  • Fully Automatic Mining of Large Time-series Datasets

Search this article

Description

本論文では,大規模時系列データのための特徴自動抽出手法であるAutoPlaitについて述べる.AutoPlaitは,様々な時系列パターンを含む複雑なシーケンスが与えられたときに,そのシーケンスデータの中から重要な特徴を発見し,それらの情報を統計的に要約,表現する.提案手法は,(a)大規模時系列データの中から類似した部分シーケンスのパターンを抽出し,(b)計算量は入力データのサイズに対して線形である.さらに,最も重要な点として,(c)提案手法はパラメータに依存しない.すなわち,事前情報の付与またはパラメータのチューニングを行うことなく,大規模シーケンスのパターン発見と特徴抽出を自動で行うことができる.実データを用いた実験では,AutoPlaitが様々な時系列データの中から有用なパターンを正確に発見することを確認し,さらに,最新の既存手法と比較を行い提案手法が大幅な精度,性能向上を達成していることを明らかにした.

In this paper we present AutoPlait, a fully automatic mining algorithm for co-evolving time sequences. Our method has the following properties: (a) effectiveness: it operates on large collections of time-series, and finds similar segment groups that agree with human intuition; (b) scalability: it is linear with the input size, and thus scales up very well; and (c) AutoPlaitis parameter-free, and requires no user intervention, no prior training, and no parameter tuning. Extensive experiments on 67GB of real datasets demonstrate that AutoPlaitdoes indeed detect meaningful patterns correctly, and it outperforms state-of-the-art competitors as regards accuracy and speed: AutoPlaitachieves near-perfect, over 95% precision and recall, and it is up to 472 times faster than its competitors.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top