機械の目が見たセカイ　-コンピュータビジョンがつくるミライ(29) 動く人・物を追跡する(3) - OpenCVのトラッキング手法(中編)

第28回では、OpenCVに組み込まれているトラッキング手法の5つの手法のうち、Boosting、MIL、Median Flowをご紹介しました。今回は、残りの2つの手法のうちTLDの概要についてまとめたいと思います。

TLD (Tracking Learning Detection)

TLD[1]は、追跡対象の物体の画像を随時学習しながら追跡を行う手法です。学習、検出、追跡の3つのStepを毎フレーム行います(図1)。

図1 TLDの処理の流れ

・Step1:

最新の学習データを用いて2クラス識別器の学習を随時行います。追跡を開始する初期フレームでは、追跡対象のBounding Boxを手動で与え、そのBounding Box内からPositiveサンプルを、その周辺の領域からNegativeサンプルを生成します。

・Step2:

次に最新の学習結果を用いて、画像全体を探索し追跡対象の物体を検出します。このとき、識別器は追跡対象がひとつであるにも関わらず、複数検出してしまったり、ひとつも検出できなかったりということが生じます。TLDではPL-Learningというアルゴリズムを用いて、学習データのPositiveサンプル、Negativeサンプルを更新します(図2)。

具体的には、P-expertと呼ばれる処理で、時系列の追跡情報(軌跡)をもとに検出結果が正しいか否かを判定します。もし、追跡処理で得られた現在位置の画像領域が、追跡中の物体ではないと判定されてしまっていた場合は、その画像領域をPositiveサンプルとして追加します。これにより、検出漏れを抑制していくことができます。

N-expertと呼ばれる処理では、空間方向の制約(追跡結果から得られる現在位置と追跡対象物は画像中にひとつしか存在し得ないという制約)をもとに画像中のPositiveとして判定された検出結果が正しいか否かを判定します。まず、追跡結果から得られる現在位置を用い、最も確からしい検出結果をひとつ選出します。そして、その最も確からしいと判定された検出結果とオーバーラップしていない検出結果をNegativeサンプルとして追加します。つまり、追跡対象物ではないにも関わらずPositiveとして誤検出してしまった画像領域をNegativeサンプルに追加することにより、誤検出(過剰な検出)を減らすことができます。

図2 P-N Learningの概要

・Step3:

追跡処理にはMedian Flowを用います。追跡対象のBounding Boxをグリッド状に分割し、各グリッド内の点の動き(Flow)を求めます。そして、トラッキングエラーが大きいFlowを除去し、残ったFlowの中央値を用いてBounding Boxの座標を更新します。このとき、各グリッドのFlowのばらつきが閾値以上の場合、物体が完全に隠れてしまった、あるいは画像の視野外に出てしまったと判定します。

＜動画1 TLDによるトラッキング結果＞

TLDによるトラッキング結果は、動画1のとおりです。P-N Learningにより、追跡処理を繰り返せば繰り返すほど識別器の精度を向上させることができます。また、追跡処理と検出処理が独立しているため、物体が隠れた場合や、物体が画像の視野外に出てしまった場合、追跡処理が失敗した場合もリカバリーすることができます。

実際に使ってみた印象としては、物体の見え方の変化が小さい場合は精度良く追跡することができますが、回転や変形により見え方の変化が大きい場合は苦手なようです。

参考文献
[1] Kalal, Z., Mikolajczyk, K., Matas, J.: Tracking-learning-detection. TPAMI 34(7), 1409-1422 (2012)

著者プロフィール

樋口未来(ひぐち・みらい)
日立製作所日立研究所に入社後、自動車向けステレオカメラ、監視カメラの研究開発に従事。2011年から1年間、米国カーネギーメロン大学にて客員研究員としてカメラキャリブレーション技術の研究に携わる。

日立製作所を退職後、2016年6月にグローバルウォーカーズ株式会社を設立し、CTOとして画像/映像コンテンツ×テクノロジーをテーマにコンピュータビジョン、機械学習の研究開発に従事している。また、東京大学大学院博士課程に在学し、一人称視点映像(First-person vision, Egocentric vision)の解析に関する研究を行っている。具体的には、頭部に装着したカメラで撮影した一人称視点映像を用いて、人と人のインタラクション時の非言語コミュニケーション(うなずき等)を観測し、機械学習の枠組みでカメラ装着者がどのような人物かを推定する技術の研究に取り組んでいる。

専門:コンピュータビジョン、機械学習

動く人・物を追跡する(3) - OpenCVのトラッキング手法(中編)

TLD (Tracking Learning Detection)

参考文献

著者プロフィール

この連載の前後回

AIが勧める、あなたのための会員限定記事

次世代ガンマ線望遠鏡による月観測で銀河宇宙線の間接的測定を実現　阪大

軍事とIT 第618回ミッション・エンジニアリングとMBSE(1)機敏さ・迅速さが求められる装備開発

設定5分で通信できる、スターリンク搭載のMONETマルチタスク車両

NEC、セキュリティリスク対策製品にAI活用の効率的なアラートの絞り込み機能等を追加

植物だって昼寝する。気象衛星ひまわりで30分毎に活動推定の新手法

積水化学工業、PFASフリーの半導体製造向け超純水用配管材の技術確立にめど

積水化学工業、PFASフリーの半導体製造向け超純水用配管材の技術確立にめど

吉川明日論の半導体放談第343回「聖域なき改革」を進めるIntelのLip-Bu Tan、AI半導体で強固な地盤を築くAMDのLisa Su

DNPが光電融合関連の研究開発拠点をオランダに開設、パッケージ部材開発を加速

四国化成工業、香川県坂出市に先端半導体向け材料生産拠点を新設へ

TSMCの2025年第2四半期売上高は前年同期比38.6％増で過去最高を更新

ロームが半導体製造工程に量子技術を活用、セットアップ時のロスを40％削減

このカテゴリーについて

動く人・物を追跡する(3) - OpenCVのトラッキング手法(中編)

TLD (Tracking Learning Detection)

参考文献

著者プロフィール

この連載の前後回

AIが勧める、あなたのための会員限定記事

次世代ガンマ線望遠鏡による月観測で銀河宇宙線の間接的測定を実現 阪大

軍事とIT 第618回 ミッション・エンジニアリングとMBSE(1)機敏さ・迅速さが求められる装備開発

設定5分で通信できる、スターリンク搭載のMONETマルチタスク車両

NEC、セキュリティリスク対策製品にAI活用の効率的なアラートの絞り込み機能等を追加

植物だって昼寝する。気象衛星ひまわりで30分毎に活動推定の新手法

積水化学工業、PFASフリーの半導体製造向け超純水用配管材の技術確立にめど

積水化学工業、PFASフリーの半導体製造向け超純水用配管材の技術確立にめど

吉川明日論の半導体放談 第343回 「聖域なき改革」を進めるIntelのLip-Bu Tan、AI半導体で強固な地盤を築くAMDのLisa Su

DNPが光電融合関連の研究開発拠点をオランダに開設、パッケージ部材開発を加速

四国化成工業、香川県坂出市に先端半導体向け材料生産拠点を新設へ

TSMCの2025年第2四半期売上高は前年同期比38.6％増で過去最高を更新

ロームが半導体製造工程に量子技術を活用、セットアップ時のロスを40％削減

このカテゴリーについて

次世代ガンマ線望遠鏡による月観測で銀河宇宙線の間接的測定を実現　阪大

軍事とIT 第618回ミッション・エンジニアリングとMBSE(1)機敏さ・迅速さが求められる装備開発

吉川明日論の半導体放談第343回「聖域なき改革」を進めるIntelのLip-Bu Tan、AI半導体で強固な地盤を築くAMDのLisa Su