大量データストリームの類似探索手法

Bibliographic Information

Other Title
  • タイリョウ データ ストリーム ノ ルイジ タンサク シュホウ
  • A Similarity Search Method for Multiple Data Streams

Search this article

Description

現在データストリームを利用したアプリケーションに対する注目が様々な分野で集まっている.データストリームを処理するには今までにない新しいアプローチが必要である.本論文は複数のデータストリームの中から任意の長さで正確に類似したシーケンスの組合せを探索する問題を対象とする.我々は,(1)シーケンスの特徴量をメモリ内で保持し,(2)圧縮されたシーケンスをディスク内に保持する手法DAPSS(DAta stream Processing for Store and Search)を提案する.DAPSSを検証した結果ナイーブな手法と比較して高速に処理が行えることを確認した.

There is much interest in the processing of data streams for applications in the several fields. The key characteristic of stream data demands a new approach. This paper focuses on the problem to detect exactly similar pairs among multiple data streams with similarity queries of arbitrary length. We propose DAPSS (DAta stream Processing for Store and Search), an efficient method to detect similar streams, which keeps (1) the feature data of each sequence in memory space and (2) the compressed data of the original sequences in disk space. Experiments show DAPSS is significantly faster than the naive method.

Journal

References(21)*help

See more

Details 詳細情報について

Report a problem

Back to top