今回と次回は、コンピュータビジョンが何に使えるのかをより具体的に知っていただくために、応用事例をまとめたいと思います。コンピュータビジョンの技術については、第4回以降に解説していく予定です。

コンピュータビジョンの要素技術

まずは、コンピュータビジョンを技術分野ごとに大まかに分類してみましょう(著者注:この分類は一例です)。コンピュータビジョンは、下記の要素技術で構成されています。

1:撮影

各画素ごとに映っている物体までの距離を計測できるToF(Time of Flight)カメラ、撮影後に焦点合わせができるライトフィールドカメラなど

2:補正・加工

写真のコントラストや色調の補正、カラーのモノクロ化、セピア調画像への変換、ノイズ除去、レンズ歪の補正、写真の結合(パノラマ画像)、写真の合成など

3:検出・認識

顔や車の検出、映っているシーンの認識など

4:追跡・動き解析

動画像中の人や車の追跡、ジェスチャー認識など

5:計測

物体の大きさ、距離の計測、3D形状の計測など

コンピュータビジョンの応用範囲

次に、応用の観点から大まかに分類してみましょう(著者注:この分類は一例です)。ロボットや自動車などに加え、一般ユーザが目にすることは無い工場でもすでに画像処理は活用されています。実際にどういった技術が実用化されているかは、次節で紹介します。

  1. ロボット
  2. セキュリティ
  3. 自動車・高度道路交通システム(ITS:Intelligent Transport System)
  4. 工業用画像処理(FA:Factory Automation)
  5. 医療画像処理
  6. 人の生活支援(家電、Webサービス、スマートフォンアプリなど)
  7. エンターテイメント(ゲーム、映画など)

コンピュータビジョンの応用事例

第1回の記事で紹介した応用事例については省略していますので、第1回を読んでいない方はそちらも合わせて読んでみて下さい。

1:ロボット

  • ドローン(無人航空機)の自動飛行

カメラを用いてユーザを自動で検出・追尾しながら、映像を撮影することができるLilyという製品が発表されました。

Introducing the Lily Camera

  • 掃除ロボット

Dysonの掃除ロボットは、360度カメラを用いて部屋の地図を作成して現在位置を把握し、部屋の中をくまなく掃除することができます。

See the new Dyson 360 Eye robot vacuum cleaner in action #DysonRobot

2:セキュリティ

  • セキュリティゲートでの個人認証

空港の税関を通過する際に、ブラックリストに載っている人物を、監視カメラ映像から自動で検出するシステムが導入されつつあります。また、手のひらや指を端末にかざすことで個人認証を行う静脈認証でも、コンピュータビジョンの技術が活用されています。近赤外線を照射し、カメラで撮像した画像をもとに個人認証を行っています。

  • 監視カメラ

一部の監視カメラでは、映像を単に録画するだけでなく、侵入者を自動で検知する機能や、録画した膨大な映像から人が映っているシーンのみを検索する機能などが搭載されています。さらに、監視カメラ映像から常に人を検知し追跡することで、人のいる場所や移動軌跡を求め、それらの情報を省エネやマーケティングに活用することも可能になってきています。

3:自動車・高度道路交通システム

  • 自動ブレーキ機能

スバル(富士重工業)のEyeSightは、2台のカメラを用いて3D計測を行うステレオカメラにより、周囲の車両、歩行者、車線を検出します。そして、前方の車両の速度に合わせて自車速を制御することや、衝突の危険性がある場合に自動で急ブレーキをかけることができます。

新世代の車載ステレオカメラ - 日立

  • 駐車支援

車両前後左右に取り付けられたカメラ映像の視点を変換、結合することで、車を真上から見た映像を生成し、駐車を支援するシステムが製品化されています(日産のアラウンドビューカメラ、ホンダのマルチビューカメラシステム、トヨタのパノラミックビューモニター)。

エルグランド:新型アラウンドビューモニター

  • ナビゲーションの高精度化

一部のカーナビに搭載されている地図には、横断歩道などの道路標示の位置情報が登録されています。本来は駐車時に使用するリアカメラを用いて、通常の走行時に横断歩道などの道路標示を検出し、GPSの誤差を補正する技術が製品化されています。

  • ナンバープレート読み取り

一部の大型スーパーの駐車場では、精算機で事前に精算しておくと、駐車券を挿入することなく駐車場出口で自動的にバーがあがります。これは、入庫時に駐車券を発券すると同時にナンバープレートを撮影します。そして、出庫時にそれらのデータをもとに清算済みの車か否かを判定してゲートを開けるシステムです。ゲートの自動開閉だけでなく、入庫時間、出庫時間、過去の入庫履歴などを、マーケティングに活用しているそうです。

後半となる次回は4番目の工業用画像処理(FA)から7番目のエンターテイメントまでの応用事例について紹介しようと思います。

著者プロフィール

樋口未来(ひぐち・みらい)
日立製作所 日立研究所に入社後、自動車向けステレオカメラ、監視カメラの研究開発に従事。2011年から1年間、米国カーネギーメロン大学にて客員研究員としてカメラキャリブレーション技術の研究に携わる。

現在は、日立製作所を退職し、東京大学大学院博士課程に在学中。一人称視点映像(First-person vision, Egocentric vision)の解析に関する研究を行っている。具体的には、頭部に装着したカメラで撮影した一人称視点映像を用いて、人と人のインタラクション時の非言語コミュニケーション(うなずき等)を観測し、機械学習の枠組みでカメラ装着者がどのような人物かを推定する技術の研究に取り組んでいる。また、大学院での研究の傍ら、フリーランスとしてコンピュータビジョン技術の研究開発に従事している。

専門:コンピュータビジョン、機械学習