データ・レイアウトとスケジューリングの最適化によるテープ上のストリーム・データ分析高速化

説明

センサ・データやパケット・データ,ログ・データ等,時々刻々と生成されるストリーム・データを保存しておくことで,過去の事象を遡って分析することが可能になる.大容量化・高速化が進むテープは,そうした大量のストリーム・データを低コストで格納する用途に適している.しかし,テープはシーケンシャル・アクセス性能に優れる一方,ランダム・アクセス性能が低く,また,カートリッジ交換のオーバヘッドも大きい.そのため従来は,テープに保存されたストリーム・データに直接アクセスしてデータ分析を行うことは難しかった.本論文では,テープに保存されたストリーム・データへの SQL アクセスを高速化する手法を提案する.提案手法は,クエリ実行履歴の分析結果に基づき一部のカラムを元データとは別のカートリッジにコピーし,クエリ実行時にアクセスするカートリッジを選択することで,読み出し性能を向上させる.簡易的なベンチマークを用いた予備実験により,本手法による性能向上の可能性を評価する.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ