集合匿名化データの多変量解析評価
書誌事項
- タイトル別名
-
- Evaluation of Multivariate Analysis on Group-Based Anonymized Data
説明
個人データの開示リスクを抑える手法の一つとして集合匿名化が知られているが,集合匿名化を施したデータの有用性については現状あまり明らかではない.特に多変量解析のように多変数からなるデータを扱う場合は,集合匿名化によってデータの有用性が著しく低下する「次元の呪い」の問題が指摘されている.本稿では次元の呪いの対策として,多変数からなる個人データを変数の少ない部分集合の組に分割して各々に集合匿名化を施す手法に着目し,多変量解析を例に本手法の有効性を考察する.また実際の医療情報に集合匿名化を施したデータを用いて,代表的な多変量解析である重回帰分析を行い,本手法の効果を実験的に検証する.
A group-based anonymization such as $k$-anonymization method is known as a disclosure control method for personal data, however, its practical effort has been determined yet. In particular, the dimensionality curse problem makes the anonymization of multivariable data difficult while the multivariable data is also extremely useful for elaborate analyses. In this paper, we focus on an approach that selects several subset tables from the multivariable data and provides individually anonymized subset tables. We experimentally verify usability of the divided anonymized tables for multiple regression analysis using medical information.
収録刊行物
-
- コンピュータセキュリティシンポジウム2012論文集
-
コンピュータセキュリティシンポジウム2012論文集 2012 (3), 647-654, 2012-10-23
情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050292572102834816
-
- NII論文ID
- 170000072746
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles