低消費電力で4K解像度の処理を可能とするAI推論LSI

NTTは、AI推論における解像度制約を4Kの高精細映像にまで拡張し、リアルタイムで、低電力で処理することができる「AI推論LSI」を開発したと発表した。NTTイノベーティブデバイスにおいて、2025年度内に製品化する予定だ。

エッジ端末などへの搭載が可能であり、具体的な用途として、同LSIをドローンに搭載することで、地上150mの高さから、広域に渡って人やモノを検出し、目視外で安全航行したり、設備点検などへの応用が可能になったりするという。

映像AI技術を活用した領域のひとつとして、ドローンの目視外飛行や、ドローンを使用した人流分析および交通分析、自動被写体追跡などのアプリケーション活用があるが、その際には、4Kなどの高精細カメラ1台で、広範囲の物体をリアルタイムに、低電力で検出する技術が求められていたものの、これまでの技術では、解像度の低さや、リアルタイム性の面で課題があった。

NTTデバイスイノベーションセンタ コンピューティングデバイスプロジェクト 主幹研究員の中村健氏は、「一般的に、AI推論処理は、計算量抑圧や学習容易性の観点から、入力画像サイズが制限されており、YOLO v3公式モデルの最大入力サイズは608×608ピクセルに制限されている。そのため、カメラで撮影した3840×2160ピクセルの4K映像を制約サイズまで縮小し、AI推論処理を行っているため、小さな物体などの被写体が潰れてしまい、AIによる検出が困難になるという課題があった。今回開発したAI推論LSIでは、高精細映像を分割して処理し、AI推論結果を合成する手法により、AI推論の解像度制約の拡張を実現した」という。

  • NTTデバイスイノベーションセンタ コンピューティングデバイスプロジェクト 主幹研究員の中村健氏

    NTTデバイスイノベーションセンタ コンピューティングデバイスプロジェクト 主幹研究員の中村健氏

  • 高精細画像をそのままAI推論処理することは難しいという課題があった

    高精細画像をそのままAI推論処理することは難しいという課題があった (出所:NTT)

解像度の制約を分割処理と全体処理の結果の合成で解決

NTTでは、AI推論高精細化技術を開発。入力画像を制約画像サイズに分割して分割画像ごとに物体検出を実施する分割処理を行うほか、分割画像をまたがる大きな物体は検出ができないため、画像全体を縮小して物体検出を行う全体処理を行い、分割処理の結果と全体処理の結果を合成する合成処理によって、解像度制約の拡張を実現するという。

この記事は
Members+会員の方のみ御覧いただけます

ログイン/無料会員登録

会員サービスの詳細はこちら