秘匿クロス統計:組織横断の安全なデータ活用の実現

抄録

データに基づく意思決定は広く社会に浸透し,さまざまな社会・産業における最適化や課題解決に広く活用されつつある.その一方で,それらのデータは個人のプライバシー情報を含みうるものであり,その活用には十分かつ適切なプライバシー保護が求められる.プライバシーを保護したデータ活用の手段として「統計情報としての活用」が挙げられる.元々のデータがプライバシー情報を含むものであっても,それらのデータから集団の傾向や性質のみを得られるよう処理した統計情報は,個人との対応関係が適切に排斥されていればプライバシーを暴露することはない.たとえば日本の個人情報保護法は,そのように適切に作成された統計情報は個人情報保護法の対象外としており,EU など海外でも一般に同様である.NTT ドコモのモバイル空間統計は,その大規模な活用例の一つであり,携帯電話ネットワークの運用データに基づいて,非識別化処理,集計処理,秘匿処理の三段階の処理を通じて作成された人口統計である.これらの処理により特定個人との対応関係が排斥されているため,モバイル空間統計を用いて個々人の行動を追跡することはできないが,集団としての人々の社会活動の推移,たとえばいつ頃にどのような場所にどのような人々が集まり,それが時間の経過とともにどう変化していくかを把握することができる.その応用として,まちづくりや防災計画,観光振興,商圏分析などの社会・産業の最適化や課題解決に用いられるとともに,2020 年から大きな社会問題となった新型コロナウイルス (COVID-19) の感染拡大抑止にも活用された.しかし,モバイル空間統計だけで把握できる社会活動には限界がある.たとえば,モバイル空間統計を用いることにより,ある空港施設周辺の人口分布やその時間推移を把握することはできるが,それらの人々が飛行機で移動するために来訪しているのか,それとも見送りなどのために来訪しているのかはわからない.前述の通り,モバイル空間統計はすでに特定個人との対応関係が排斥されているため,たとえば航空機の搭乗データなどを用いて事後にそれらを分離することも不可能である.これは,モバイル空間統計に限らず,公的統計などを含めた様々な統計情報において共通的にあてはまる課題である.この問題を解決するために,異なる企業や組織が保有するデータを統計化の前に結合し,その結合データに基づいて統計情報を作成することが考えられるが,これを安全に実現する方法は自明ではない.たとえば組織 A と組織 B がそれぞれ保有するデータを結合して統計情報を作成しようとするとき,どちらかのデータを相手に渡してしまうと,そこでプライバシーの漏洩が発生する.また,いわゆる秘密計算を利用しても,その集計結果が個人のプライバシーを暴露しないとは限らない.一見して個人のプライバシーを含まないように見えても,たとえばデータベース再構築攻撃などによる分析を通じて,集計結果から個人のプライバシーが暴露されうることが知られている.さらに,k-out-of-n 秘密分散に基づく秘密計算を用いる場合,自分自身が何ら不正や間違いを起こさずとも,自分以外の他者が不正に結託すると自身のデータが復元されうる (プライバシーも暴露される) .秘匿クロス統計は,準同型暗号や差分プライバシーなどのプライバシー保護技術を組み合わせることにより,上記の課題を解決する技術である.すなわち,1 ) 出力されるデータは適切にプライバシーが保護された「統計情報」であること,2 ) (自らの不正がない限り) 出力される統計情報以外に自らのデータに関する情報が漏洩しないこと,の二点を保証することにより,組織横断での安全なデータ活用を実現する.その最初の応用として,2022 年 11 月より航空輸送の円滑化に向けた共同実証を JAL / JAL カード/ NTT ドコモの三者で実施している.本講演では,上記で示した組織横断でのデータ活用における課題について議論するとともに,秘匿クロス統計技術の技術的ポイントおよび共同実証の内容について概説する.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ