KDDI研究所は2月4日、サイトに投稿されたコンテンツの中から個人情報に該当する箇所を検出し、サイト管理者の目視による除去作業の効率化を手助けする、個人情報検出ツールを開発したと発表した。
同ツールは、テキストに含まれる個人情報を自動判定するほか、検出した個人情報を伏せ字に自動変換するため、目視確認作業のスピードアップが期待できる。
このツールに対象テキストデータをアップロードすることで、独自の判定処理により「住所」や「一般的な氏名」「電話番号」「メールアドレス」といった自動検出を行い、Webブラウザ上に自動判定結果と伏せ字処理結果を1件ずつ表示する。
同社による判定実験では、1分間に1200件(1秒あたり20件)の投稿から個人情報を検出・変換したほか、個人情報該当箇所の検出精度も約94%であったという。これらの効果により、1投稿の目視チェックに平均30.2秒かかっていたものが、約1/3程度の10秒まで短縮するが可能となっている。
ほかにも、ボタンを押すことで1投稿ごとの確認作業を進められるインタフェースを備えており、単語登録機能によって個人情報以外のキーワード検出もできる。
なお、今回の技術は、独立行政法人情報通信研究機構からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の研究成果の一部が活用されている。