日立、数百万件の画像データから類似画像を1秒以内で検索する技術を開発

日立製作所は24日、大規模な画像や映像データの中から、指定した画像と見た目が似ているデータを1秒以内(数百ミリ秒)で高速検索する類似画像検索技術を開発したと発表した。画像自体が持つ視覚情報(色分布、質感、構図など)を工夫することで、高速かつメモリ消費量を抑えた検索を可能にした。

この技術はすでに実用化されていたが、検索時の処理量が大きいため、大規模なデータの取り扱いは困難だった。類似画像検索は、検索の対象となる画像から視覚的な情報を数百次元の数値列データ(画像特徴量)で示し、データ間の「似ている度合い(類似度)」を、画像特徴量の違い(画像特徴量ベクトル間の距離)で評価する。類似画像検索を行う場合は、この数百次元の画像特徴量の違いを計算する必要があるため、検索対象が数百万件規模になると、その演算量は膨大になり、検索時間の高速化が課題となっていた。

今回発表された技術は、値の近い画像特徴量データを1つのグループにまとめる「クラスタリング処理」を行い、平均画像特徴量の類似したクラスタどうしの記録場所を近くに配置する最適化処理することで、高速検索を可能にしている。映像検索にも適用できるため、長時間の映像データの中から特定の人物が出ているシーンを瞬時に検索する画像/映像検索アプリケーションなども実現可能だ。