機械の目が見たセカイ　-コンピュータビジョンがつくるミライ(27) 動く人・物を追跡する(1) - OpenCVによるトラッキング

本連載の第13回から16回にわたって機械学習による顔・人・物体の検出、識別についてご紹介しました。1枚の画像から顔・人・物体を検出するだけでなく、動画像の連続するフレームから検出する場合は、トラッキング処理が必要となります。トラッキング処理を用いた場合、一度物体を見つけた後はその周辺のみを探索すれば良いので、誤検出や未検出を抑制することができます。さらに、フレーム間の物体の対応関係から動きの軌跡を求めることができます(動画1)。

＜動画1 Multi-Target Trakingの一例＞

オープンソースライブラリ OpenCVによるトラッキング

OpenCV 3.0以降では、エクストラモジュール(opnecv_contrib)を追加することで、さまざまな機能を使うことができます。そのエクストラモジュールにはトラッキングが含まれているので、OpenCVを使って人や物体の追跡をすごく簡単に実装できます。ただ、エクストラモジュールを使用するためには、cmakeでopencv_contribを有効にしてコンパイルする必要があります。コンパイルの方法は、Googleで検索すればいろいろと見つかりますので、そちらを参考にしてください。

OpenCVのトラッキングのコードはすごくシンプルです。

Trackerインスタンスの生成: cv::Tracker::create("アルゴリズム名")
初期化: cv::Tracker::init(トラッキングを開始する画像, 対象物の外接矩形)
更新: cv::Tracker::update(最新の画像, 対象物の外接矩形)

の3ステップのみです。ループ処理で動画の画像を読み込み、3.のTrackerの更新を繰り返すだけです。

複数物体用のAPIも用意されています。複数物体用のMultiTrackerも先ほどと同様に、

Trackerインスタンスの生成: cv::MultiTracker::create("アルゴリズム名")
初期化:cv::MultiTracker::add(トラッキングを開始する画像, 対象物の外接矩形)
更新:cv::MultiTracker::update(最新の画像, 対象物の外接矩形)

の3ステップのみです。

トラッキングアルゴリズムは、

Boosting
MIL
TLD
MedianFlow
KCF

があります。どの方向から見ても見え方に変化のない単一色の球体か、剛体であっても角度により見え方が異なる物体か、人のように姿勢が変化する非剛体か、などトラッキング対象によってトラッキング精度が異なるので、すべてのアルゴリズムを比較してみることをおすすめします。すでに、トラッキング精度を比較した結果も多数公開されていますので、動画検索もしてみてください(動画2)。

＜動画2 OpenCVのTraking APIによる物体追跡結果＞

トラッキングは、自動車やロボットの衝突防止、店舗内の顧客の動線解析、スポーツ映像の選手・ボールの動き解析、スマートフォンカメラアプリの高機能化など、応用範囲が多岐にわたる重要な技術です。興味のある方はまずはOpenCVを使ってトラッキングを実装してみてください。

著者プロフィール

樋口未来(ひぐち・みらい)
日立製作所日立研究所に入社後、自動車向けステレオカメラ、監視カメラの研究開発に従事。2011年から1年間、米国カーネギーメロン大学にて客員研究員としてカメラキャリブレーション技術の研究に携わる。

日立製作所を退職後、2016年6月にグローバルウォーカーズ株式会社を設立し、CTOとして画像/映像コンテンツ×テクノロジーをテーマにコンピュータビジョン、機械学習の研究開発に従事している。また、東京大学大学院博士課程に在学し、一人称視点映像(First-person vision, Egocentric vision)の解析に関する研究を行っている。具体的には、頭部に装着したカメラで撮影した一人称視点映像を用いて、人と人のインタラクション時の非言語コミュニケーション(うなずき等)を観測し、機械学習の枠組みでカメラ装着者がどのような人物かを推定する技術の研究に取り組んでいる。

専門:コンピュータビジョン、機械学習

動く人・物を追跡する(1) - OpenCVによるトラッキング

オープンソースライブラリ OpenCVによるトラッキング

著者プロフィール

この連載の前後回

Members+ 会員限定記事

「なんか通いにくい」歯科医院の課題、デジタル化による患者体験向上で解決を

イノベーション都市・横浜の“今”を追う第1回なぜスタートアップ企業を支援するのか

業界特化型SaaSの事業経営者が語る、成功の秘訣と今後のトレンド

航空機の技術とメカニズムの裏側第430回航空機とセンサー(12)曳航するセンサーあれば、吊るすセンサーあり

トヨタマリンがVBベースのサプライチェーン基盤をOracle Cloudに移行、その狙いとは

目指すはオンプレPBXの全廃! 日本航空が取り組むクラウドPBX移行の現状

東芝、量子インスパイアード計算機を用いた5G基地局向けリソース制御技術を開発

島津製作所の米国子会社が3地域でR＆Dセンターを開所 - 製薬事業拡大へ

住友ゴムと村田製作所、タイヤの摩耗を可視化する新システムを共同開発

NTT Comの「アプレット領域分割技術」を活用したSIMが自販機のキャッシュレスを推進へ

PCI-SIG、PCI Express 7.0のRevision 0.5 Draft完成をアナウンス

あらゆるAIニーズに旧Xilinxとのシナジーで対応を進めるAMD、日本でも市場を拡大

このカテゴリーについて

動く人・物を追跡する(1) - OpenCVによるトラッキング

オープンソースライブラリ OpenCVによるトラッキング

著者プロフィール

この連載の前後回

Members+ 会員限定記事

「なんか通いにくい」歯科医院の課題、デジタル化による患者体験向上で解決を

イノベーション都市・横浜の“今”を追う 第1回 なぜスタートアップ企業を支援するのか

業界特化型SaaSの事業経営者が語る、成功の秘訣と今後のトレンド

航空機の技術とメカニズムの裏側 第430回 航空機とセンサー(12)曳航するセンサーあれば、吊るすセンサーあり

トヨタマリンがVBベースのサプライチェーン基盤をOracle Cloudに移行、その狙いとは

目指すはオンプレPBXの全廃! 日本航空が取り組むクラウドPBX移行の現状

東芝、量子インスパイアード計算機を用いた5G基地局向けリソース制御技術を開発

島津製作所の米国子会社が3地域でR＆Dセンターを開所 - 製薬事業拡大へ

住友ゴムと村田製作所、タイヤの摩耗を可視化する新システムを共同開発

NTT Comの「アプレット領域分割技術」を活用したSIMが自販機のキャッシュレスを推進へ

PCI-SIG、PCI Express 7.0のRevision 0.5 Draft完成をアナウンス

あらゆるAIニーズに旧Xilinxとのシナジーで対応を進めるAMD、日本でも市場を拡大

このカテゴリーについて

イノベーション都市・横浜の“今”を追う第1回なぜスタートアップ企業を支援するのか

航空機の技術とメカニズムの裏側第430回航空機とセンサー(12)曳航するセンサーあれば、吊るすセンサーあり