KDDI研究所は9月29日、事業者が所有するパーソナルデータの多面的な安全性を考慮した匿名加工情報の作成が可能なツールを開発したと発表した。

k-匿名化、ノイズ付与、ランダムサンプリングといった加工手法ごとに異なる安全性(匿名化の度合い)が決められているが、今回開発したツールでは、データセットの特徴を抽出、指標間の関係性をモデル化することで、それぞれの安全性を同一の指標で評価できるようにし、これらの加工手法の最適な組み合わせを求めることが可能となったという。

安全性を満たすために強いk-匿名化を行い、有用性が大きく損なわれるような場合でも、同ツールでは別の手法を組み合わせることで、同じ安全性で高い有用性を持つデータの生成を行うことができる。

手法の組み合わせは選択可能なため、医療データのように繊細なデータの加工を行う場合は、サンプリングと汎化、レコードの削除のみを使用し、ノイズ付加は行わないといったことも可能となっている。

また、データの生成時には、k-匿名性以外にも懸念されるリスクについて多面的な評価を行って可視化しレポートとして出力するため、ひと目で生成した匿名加工情報が持つ安全性を確認可能としている。

同社では、大規模データに対応できるように、加工や評価をクラウド上で行うことで高速化を図るなど、実用化を目指した技術開発に取り組んでいく。

KDDI研究所が開発した匿名加工情報作成ツールの仕組み