日立製作所は3月27日、人工知能(AI)を活用することで、人物の性別や服の色、所持品といった12種類100項目以上の人物の特徴をリアルタイムに判別し、かつそれらを組み合わせることで、探したい人を即座に発見し、追跡を可能とする技術を開発したと発表した。

同技術は、大規模イベントにおける不審者の発見や迷子探索などでの活用を期待して開発が進められているもので、従来手法では、1つひとつの特徴を個別に識別させて対応させるため、対象人物の絞込みなどが難しかったところを、ディープラーニングを活用することで、「性別」、「年齢」、「装飾品」、「上半身の色」、「下半身の色」、「履物の色」、「上半身のスタイル」、「下半身のスタイル」、「履物のスタイル」、「髪型」、「髪の色」、「持ち物」という12種類のパラメータに対し、同時処理を実行し、合計100項目を導き出す推論にかかる処理時間を、従来ソリューション比で約1/40となる約20msで達成することを可能とした。

従来の映像解析技術では、群集の中に同じ特徴を持つ人物が複数いる場合、絞込みができなかったり、顔で識別しようとしても、顔がはっきりと映っていないと追跡できないといった課題があった。今回、それぞれの特徴を複合的に抽出できる手法をディープラーニングを用いて考案。これにより、複数の特徴を踏まえた人物を高速に特定できるようになったという

具体的には、最初に人である、というシルエットなどの概要的な粗い情報を共通ニューラルネットワークで学習を行い、その後、二段階学習として、そうして抽出された情報から、12種類の特徴を導き出す学習方法を考案。これにより、複数の特徴を同時に処理する「高速人物発見技術」を実現したとする。

特徴は12種類。それぞれに複数の項目が用意されており、その合計数は100以上ある。それらを組み合わせて特定の人物の抽出を可能とする。画像に映っている人物たちは、同社が今回の実験に際し用意したエキストラ

また、併せて、顔の特徴量での人物特定の場合、顔が横を向いていたり、動きが違っていたりする場合は照合が難しかったものを、モノを置く/拾う、ポケットからモノを取り出す、歩く、振り返る、指をさす、といった10項目の動きを伴う全身の特徴量から判断することを可能とする高速ベクトル検索エンジンデータベースを活用することで、特定人物の発見率は従来ソリューション比で約3倍に向上したほか、検索時間も約1秒程度と、ほぼリアルタイムでの処理を可能とした「高速人物追跡技術」を実現したとする。

人物の全身画像から、動きなどを解析し、同一人物の映像を抽出することで、どこに移動しているか、といった追跡を可能とした

この検索時間については、撮影するカメラのフレーム性能などで変化するものの、同社では1億フレーム程度であれば1秒以内で検索が完了できることを確認しており、今後の演算性能の向上などを踏まえれば、ほぼほぼリアルタイムでの処理を継続して行っていくことができると見ている。

人物を抽出するには全身が映っている必要がある。10項目の動きに基づき、人物を特定していくことが可能だという

なお、同社では2年以内の事業化を果たしたいとしているほか、今回開発された技術は人間のほか、動物や車両などにも適用ができることから、そうした応用展開なども模索していきたいとしている。