大規模集計データへの差分プライバシの適用

書誌事項

タイトル別名
  • On Publishing Large Tabular Data with Differential Privacy

この論文をさがす

抄録

データの有効な活用による社会・産業の発展への期待が高まる中,プライバシを保護したうえでデータを利用するための技術が注目を集めている.そのなかで,Dworkらによる差分プライバシは,その高い安全性から大きな期待が寄せられているが,特に大規模データへの適用においてデータの有用性や処理効率などの観点から実用上の課題を持つ.本稿では,地理空間データなどの大規模な集計データに差分プライバシを適用するうえでの課題を示すとともに,これを解決する手法について安全性証明と実データに基づく評価を与える.本手法は,集計データの非負制約に着目し,その逸脱をWavelet空間において補正する過程を導入することにより有用性と処理効率の向上を実現するとともに,局所性保存写像(locality preserving mapping)の一種であるMorton順序写像を用いることにより,地理空間データなどの多次元集計データへの適用時の精度劣化を抑制することを特徴とする.

Big data become widely expected to enhance the quality and efficiency of our daily life, and methods to prevent privacy information included in the data from being disclosed by data utilization become attracting wide attention therewith. Differential privacy is a promising paradigms to achieve proven privacy, but previous methods to assure the differential privacy have several drawbacks on data utility and scalability in practice, in particular when applied to publishing large and sparse tabular data such as geospatial data. This paper proposes a novel differentially private method that simultaneously solves these problems, and demonstrates its evaluation results. The proposed method introduces a process to correct for the non-negative restriction of the output data by modifying the wavelet coefficients of the perturbed data, and this correction process enables the proposed method to efficiently process large sparse data in terms of scalability and accuracy. In addition, the proposed method effectively suppresses the amount of noise required to process multi-dimensional data by reducing its dimensionality using a locality-preserving mapping method called Morton order mapping.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050001337905869824
  • NII論文ID
    170000130720
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00145032/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ