データウェアハウス向け高性能データ圧縮方式

書誌事項

タイトル別名
  • データウェアハウス ムケ コウセイノウ データ アッシュク ホウシキ
  • A High-performance Data Compression for Data Warehouse

この論文をさがす

抄録

本稿では,データウェアハウス向けの高性能なデータ圧縮方式について報告する.近年,データウェアハウスの分野では,データを圧縮形式で格納することにより記憶装置コストの削減と入出力負荷の削減を図る方式が実用化されつつある.本稿で報告する圧縮方式は,データを列方向に分割したデータストリームを生成し,行方向の履歴を利用した符号化を行うことを特徴とする.個々のデータストリームにはランレングス符号化,インデックス符号化および差分符号化という単純だが高速な符号化方式を適用する.クエリの処理においては処理に必要なデータストリームがストレージより読み出され,各データストリームが独立に伸張される.本圧縮方式を商用データベース管理システムDIAPRISM/AQL上に付加し,実データを用いた性能評価を行った.その結果,データ圧縮の適用により必要なストレージ容量がおおむね2~14%に削減され,また,処理時間がおおむね5~23%に削減されることを確認し,本圧縮方式の有効性を確認した.

In this paper, new data compression architecture for data warehouses is presented. Recently, some database management systems have a capability of storing data in a compressed format to reduce storage cost and I/O traffic. In our compression architecture, the data is being split into multiple fixed length streams in the column direction. Each data stream is encoded using the history in the line direction by simple but fast encoding scheme such as run length encoding, index encoding and difference encoding. In the processing of a query, only the needed data streams are read from storage, and decompressed individually. We have attached the compress functionality on a commercial data base management system called DIAPRISM/AQL. Our evaluation results using the actual application data show that the storage capacity is reduced to 2窶骭€14%, and that the elapse time is reduced to 5窶骭€23%. The results show the effectiveness of the data compression architecture.

収録刊行物

参考文献 (28)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ