大規模時系列データの特徴自動抽出
Bibliographic Information
- Other Title
-
- Fully Automatic Mining of Large Time-series Datasets
Search this article
Description
本論文では,大規模時系列データのための特徴自動抽出手法であるAutoPlaitについて述べる.AutoPlaitは,様々な時系列パターンを含む複雑なシーケンスが与えられたときに,そのシーケンスデータの中から重要な特徴を発見し,それらの情報を統計的に要約,表現する.提案手法は,(a)大規模時系列データの中から類似した部分シーケンスのパターンを抽出し,(b)計算量は入力データのサイズに対して線形である.さらに,最も重要な点として,(c)提案手法はパラメータに依存しない.すなわち,事前情報の付与またはパラメータのチューニングを行うことなく,大規模シーケンスのパターン発見と特徴抽出を自動で行うことができる.実データを用いた実験では,AutoPlaitが様々な時系列データの中から有用なパターンを正確に発見することを確認し,さらに,最新の既存手法と比較を行い提案手法が大幅な精度,性能向上を達成していることを明らかにした.
In this paper we present AutoPlait, a fully automatic mining algorithm for co-evolving time sequences. Our method has the following properties: (a) effectiveness: it operates on large collections of time-series, and finds similar segment groups that agree with human intuition; (b) scalability: it is linear with the input size, and thus scales up very well; and (c) AutoPlaitis parameter-free, and requires no user intervention, no prior training, and no parameter tuning. Extensive experiments on 67GB of real datasets demonstrate that AutoPlaitdoes indeed detect meaningful patterns correctly, and it outperforms state-of-the-art competitors as regards accuracy and speed: AutoPlaitachieves near-perfect, over 95% precision and recall, and it is up to 472 times faster than its competitors.
Journal
-
- 情報処理学会論文誌データベース(TOD)
-
情報処理学会論文誌データベース(TOD) 7 (2), 37-50, 2014-06-30
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050845762834643328
-
- NII Article ID
- 110009799910
-
- NII Book ID
- AA11464847
-
- ISSN
- 18827799
-
- Web Site
- http://id.nii.ac.jp/1001/00101884/
-
- Text Lang
- ja
-
- Article Type
- article
-
- Data Source
-
- IRDB
- CiNii Articles
- KAKEN