日本電信電話(NTT)は2月7日、「パーソナルデータ匿名化システム」を開発したと発表した。プライバシーを保護したまま、ビッグデータ分析に用いられる個人に関する情報を、分析データの利用価値が高いまま加工できる。

同システムは、パーソナルデータから個人が直接特定できる情報を取り除き、さらにそのデータから誰か一人に絞り込めないようにデータを加工することで、高度なプライバシー保護対策を実施している。

匿名性の代表的な指標である「k-匿名性」を満たす匿名化技術を実装し、従来から知られている希少な人のデータを取り除く「削除」、項目の値をより粗くする「一般化」を行なっている。

また、同社が独自に開発した「Pk-匿名化」をパーソナルデータの種類や分析目的に合わせて柔軟に選択でき、従来困難とされていた高度なプライバシー保護対策を行った場合の利用価値の低下を、実用的なレベルで押さえた分析用データを作成することが可能になったという。

今回、NTTセキュアプラットフォーム研究所が開発した匿名化システムは、パーソナルデータを保有する事業者向けのソフトウェアであり、匿名性と有用性のバランスを最適化し、k-匿名性を満たした上でデータの有用性が損なわれにくい匿名化データを得ることができる。

事業者は、保有するパーソナルデータを匿名化システムに入力し、匿名化処理方法の選択と分析に用いるパーソナルデータの項目の選択、匿名性のパラメータ(kの値)を決定すると、k-匿名性を満たし、かつデータの有用性の高い「匿名化データ」が出力される。

匿名化システムの処理イメージ

匿名化データの加工方法

NTTでは、多項目を持つ"横に長い"ビッグデータの匿名化を行うときは、ビッグデータ匿名化のジレンマを回避するために、分析項目を選択して「横に短い」データにして加工する「オーダーメイド匿名化」を推奨している。

Pk-匿名化を用いれば、分析の目的に合わせて異なる項目の組みあわせでオーダーメイド匿名化を繰り返す場合でも、全体を通じてk-匿名性が損なわれないとのことだ。

オーダーメイド匿名化