大量データストリームの類似探索手法

書誌事項

タイトル別名
  • タイリョウ データ ストリーム ノ ルイジ タンサク シュホウ
  • A Similarity Search Method for Multiple Data Streams

この論文をさがす

説明

現在データストリームを利用したアプリケーションに対する注目が様々な分野で集まっている.データストリームを処理するには今までにない新しいアプローチが必要である.本論文は複数のデータストリームの中から任意の長さで正確に類似したシーケンスの組合せを探索する問題を対象とする.我々は,(1)シーケンスの特徴量をメモリ内で保持し,(2)圧縮されたシーケンスをディスク内に保持する手法DAPSS(DAta stream Processing for Store and Search)を提案する.DAPSSを検証した結果ナイーブな手法と比較して高速に処理が行えることを確認した.

There is much interest in the processing of data streams for applications in the several fields. The key characteristic of stream data demands a new approach. This paper focuses on the problem to detect exactly similar pairs among multiple data streams with similarity queries of arbitrary length. We propose DAPSS (DAta stream Processing for Store and Search), an efficient method to detect similar streams, which keeps (1) the feature data of each sequence in memory space and (2) the compressed data of the original sequences in disk space. Experiments show DAPSS is significantly faster than the naive method.

収録刊行物

参考文献 (21)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ