【連載】

機械の目が見たセカイ -コンピュータビジョンがつくるミライ

34 領域分割(1) - 概要編

34/40

今回から、複数回にわたって「画像の領域分割(Segmentation)」について紹介していきたいと思います。領域分割って何? と思われる方がいらっしゃるかもしれませんが、すごくシンプルな課題で、画像のどこからどこまでが1つの領域なのかを判定する問題です。さらにSemantic Image Segmentationという分野では、図1のように画像のどの領域が1つの物体なのかを判定すると同時に、物体の種別も推定します。

図1 画像の領域分割の例

領域分割の難しさ

これは人間にはすごくシンプルな問題でも、コンピュータにとってはものすごく難しい課題です。画像は、図2の通り四角い画素を2次元に並べたデータです。単純なプログラムを書くと、ある画素のRGB値が隣の画素のRGB値と類似していれば同じ物体に属すると判定し、しきい値以上の差異が生じていれば異なる物体に属すると判断する、という処理になります。図2の拡大画像で分かるように、同じ机の画素でも均一な値は取りません。木目調がよりはっきりしている場合や、影がある場合、テーブルクロスがかかっている場合などは、1つの机が数多くの領域に細分化されてしまいます。しきい値を緩く設定すれば良いのではないかと思われるかもしれませんが、しきい値を緩くすると机が奥の床と繋がってしまうのです。

図2 机と椅子の境界の拡大画像

Semantic Image Segmentationの例

深層学習(ディープラーニング)技術の進展に伴い、10年前では考えられない制度で領域分割と物体の種別認識ができるようになってきました。オックスフォード大学がSemantic Image Segmentationを試すことのできるWebサイトを公開しています

図1のSUN RGB-Dデータセットの画像を処理して見た結果が図3です。輪郭は綺麗に抽出できていないものの、椅子(赤い領域)、テーブル(オレンジの領域)の種別を識別し、領域分割もそれなりにできています。

図3 Semantic Image Segmentationの実行結果例(テーブルと椅子)

図4は、屋外の映像を処理した結果です。遠くの自転車は抽出できていませんが、人(ピンク色の領域)は抽出できています。そして、近くの自転車に乗った人は、自転車(緑の領域)と人を分離して抽出できています。

図4 Semantic Image Segmentationの実行結果例(自転車)

領域分割(Semantic Image Segmentationを含む)は、人間にはすごく簡単な問題ですが、コンピュータにとっては難題の1つです。近年、急速に技術が進歩している分野でもあり、応用範囲も広い技術ですので、是非いろいろと試して見てください。

著者プロフィール

樋口未来(ひぐち・みらい)
日立製作所 日立研究所に入社後、自動車向けステレオカメラ、監視カメラの研究開発に従事。2011年から1年間、米国カーネギーメロン大学にて客員研究員としてカメラキャリブレーション技術の研究に携わる。

日立製作所を退職後、2016年6月にグローバルウォーカーズ株式会社を設立し、CTOとして画像/映像コンテンツ×テクノロジーをテーマにコンピュータビジョン、機械学習の研究開発に従事している。また、東京大学大学院博士課程に在学し、一人称視点映像(First-person vision, Egocentric vision)の解析に関する研究を行っている。具体的には、頭部に装着したカメラで撮影した一人称視点映像を用いて、人と人のインタラクション時の非言語コミュニケーション(うなずき等)を観測し、機械学習の枠組みでカメラ装着者がどのような人物かを推定する技術の研究に取り組んでいる。

専門:コンピュータビジョン、機械学習

34/40

インデックス

連載目次
第40回 ハードウェアの基礎知識(4) - GPGPU
第39回 ハードウェアの基礎知識(3) - レンズ
第38回 ハードウェアの基礎知識 (2) - 電子シャッター
第37回 コンピュータビジョン分野で活躍する企業・フリーランサー インタビュー(3)
第36回 領域分割(3) - CRFを用いたSemantic Image Segmentation
第35回 領域分割(2) - Mean Shift法を用いたImage Segmentation
第34回 領域分割(1) - 概要編
第33回 見えないものを観る(3) - 目に見えない光「赤外線」を観る
第32回 見えないものを観る(2) - 絵画の下書きを観る
第31回 見えないものを観る(1) - 映像から音を復元する
第30回 動く人・物を追跡する(4) - OpenCVのトラッキング手法(後編)
第29回 動く人・物を追跡する(3) - OpenCVのトラッキング手法(中編)
第28回 動く人・物を追跡する(2) - OpenCVのトラッキング手法(前編)
第27回 動く人・物を追跡する(1) - OpenCVによるトラッキング
第26回 インターネット上の画像群からTime-lapse映像を自動生成する手法の概要
第25回 一人称視点(3) - Social Saliency
第24回 一人称視点(2) - Social Interaction
第23回 一人称視点(1) - 概要
第22回 行動認識(3) - Two-stream ConvNets
第21回 行動認識(2) - 動きの特徴量(HOF、MBH)
第20回 行動認識(1) - Dense Trajectories
第19回 視線計測(3) - カメラのみを用いた視線計測
第18回 視線計測(2) - 近赤外の点光源を用いた視線計測
第17回 視線計測(1) - 導入編
第16回 コンピュータビジョン分野における機械学習(4) - Deep Learning
第15回 コンピュータビジョン分野における機械学習(3) - 識別器
第14回 コンピュータビジョン分野における機械学習(2) - 顔検出・人検出
第13回 コンピュータビジョン分野における機械学習(1) - 導入編
第12回 コンピュータビジョン分野の市場分析(1) - 自動車編
第11回 コンピュータビジョン分野で活躍する企業・フリーランサー インタビュー(2)
第10回 カメラを用いた3次元計測(4) - Structure from Motion
第9回 カメラを用いた3次元計測(3) - サブピクセル推定
第8回 カメラを用いた3次元計測(2) - ステレオカメラ
第7回 コンピュータビジョン分野で活躍する企業・フリーランサー インタビュー(1)
第6回 カメラを用いた3次元計測(1)
第5回 意外と知らないカメラキャリブレーション
第4回 ハードウェアの基礎知識
第3回 コンピュータビジョンの要素技術と応用範囲(後編)
第2回 コンピュータビジョンの要素技術と応用範囲(前編)
第1回 普及期に入ったコンピュータビジョン

もっと見る



人気記事

一覧

イチオシ記事

新着記事