東芝は6月12日、カメラ映像に映る群衆の人数を一般的なPCで高速に計算できる画像解析AIを開発したと発表した。
世界の防犯カメラの設置数は2022年までに10億台に達するといわれており、駅や空港等の公共施設や商業施設でトラブルの原因となりやすい人の密集状態を迅速に検出し、人数や混雑状況を高精度に計測するニーズが高まっている。
また、昨今の新型コロナウイルスの感染拡大を受けて、密集状態を迅速かつ高精度に検知する技術が注目されており、近年では、AI深層学習技術を応用することで、密集度が極めて高い群集の人数の推定が可能になっている。
一方で、一般的に深層学習を用いた解析は、データの処理量が膨大でGPUなどの高価な専用演算装置が必要となるため、コストの増加が避けられず、幅広い施設への普及が困難だとされている。
同技術は、GPUは用いず、一般的なPCに内蔵されているCPU上の動作に独自の深層学習手法を用いることで、1秒間に約3台のカメラ画像を解析処理することができるようになり(CPUはIntel Core i7-6950Xを使用)、従来の深層学習手法を用いてCPUで処理した場合との比較において、約4倍の処理速度になったという。 また、画像の中で混雑している箇所を密度マップとして可視化し、流れの中で人が滞留している箇所や、密集箇所を検知することが可能だという。
さらに、人物の大きさの変化に対応するため、画像に映る複数のグループが大小どのようなサイズであっても解析できるネットワーク構造になっている。高密度な群集を撮影した群集計測のための公開データセット(ShanghaiTech-A)による評価において、今回開発した手法を適用することで、画像1枚当たりの推定人数の誤差が、16.0%から 14.7%に改善したという(世界トップ性能:13.7%)。
同社は今後、新型コロナウイルス感染予防などの応用に向けて、同技術をグループの製品・サービスへ広く活用することを検討し、2020年度中の製品化を目指すという。また、渋滞状態の解析に向けた車両数解析、在庫管理に向けた箱や商品数解析に対応するなど、解析対象を拡充していく方針だ。