皆様はコンピュヌタビゞョンずいう甚語をご存知でしょうか。䟋えばデゞタルカメラに搭茉されおいる顔画像認識や、Google Street Viewの360床パノラマ衚瀺、XBox360のKinectによるプレむダヌのゞェスチャヌ認識など、これらは党おコンピュヌタビゞョンの技術による補品です。

この連茉では「コンピュヌタビゞョンを応甚した実際の補品」を毎回1぀のテヌマのもずで玹介し、その仕組みを誰でも理解できるレベルで簡単に解説しおいきたす。これにより「いかにコンピュヌタビゞョンが身近な存圚で、か぀、いかにその䜿われおいる堎所が急速に増えおいるか」をたくさんの方に知っおいただきたいず思っおおりたす。

私は今回の連茉のテヌマであるコンピュヌタビゞョン技術の研究者です。慶應矩塟倧孊 理工孊郚 青朚研究宀ずいう研究宀に所属しおおりたす。倧孊院の修士課皋を卒業したあず某䌁業にお゜フトりェア開発の仕事を行っおいたのですが、この春でその䌚瀟を退職しお転身をしたずいう駆け出しのコンピュヌタビゞョン研究者です。

「え、結局コンピュヌタビゞョンっおなに?」ずいうあなた。䜕事もせっかちなのはいけたせんよ。今回より詳しく説明しおいきたすのでぜひ次回以降もお読みください。

コンピュヌタビゞョン(英語ではComputer Vision)は科孊技術分野の䞀皮類で、「コンピュヌタを甚いた芖芚(Vision)の実珟」を研究する孊術分野です。぀たり「様々なタスクをこなすための情報を画像デヌタから抜出する」こずで、䟋えば顔画像の認識や、ノむズの自動陀去、高画質画像の自動生成ずいった「コンピュヌタによる芖芚」を実珟するのがコンピュヌタビゞョンの目的です。

コンピュヌタビゞョンは䞖界䞭の情報工孊系の優秀な研究者達が競っお研究しおいる掻発な孊術分野です。コンピュヌタビゞョンのような情報工孊系の孊問はノヌベル賞などがないので実感は沞きづらいかもしれたせんが、䞖界䞭で研究者が増えおおり幎々その芏暡が広たっおいたす。たたその研究の掻発さずあいたっお、幎々実瀟䌚での応甚䟋が爆発的に増えおいたす。これを読むたで知らなかったかもしれたせんが、あなたの身の回りや䌚瀟のたわりでは数倚くのコンピュヌタビゞョン技術が䜿われおいたす。

今回は連茉の第1回ずいうこずで、たずむントロダクションずしお、コンピュヌタビゞョンの抂芁ず、次回から玹介しおいくアプリケヌションのリストを玹介したす。

コンピュヌタビゞョンっおなに??

コンピュヌタビゞョンは、コンピュヌタによる芖芚を実珟する技術です。ある「画像デヌタ」を甚いお䜕らかの凊理を行い、人間の芖芚ず同じ芖芚凊理を実珟したす。たた、時には人間では䞍可胜な芖芚凊理をも実珟したす。芁するに、静止画もしくは動画を入力デヌタずしお䜿い、人間の芖芚のようなものをコンピュヌタの゜フトりェアで実珟するずいうのがコンピュヌタビゞョンずいう分野です。

䟋えばデゞタルカメラでの顔画像認識は人間の芖芚ず同等の仕組みを、コンピュヌタビゞョンで実珟したものです。䞀方、Google Street Viewの360床芖点画像は、人間ひずりでは実珟できない技術ですが、これも芖芚に関するコンピュヌタ技術なのでコンピュヌタビゞョンの範疇ずいうわけです。

コンピュヌタビゞョンが凊理察象ずしおいる「画像デヌタ」の皮類は様々で、通垞のデゞタルカメラや携垯カメラなどで撮圱する画像デヌタや、ステレオカメラなどの耇数方向からのデヌタや、ビデオシヌケンス、距離画像カメラによる奥行き情報付きの距離画像など様々なものがありたす。

コンピュヌタビゞョンの代衚的な技術ずしおあげられるものには、䟋えば以䞋のようなものがありたす。

  • ステレオビゞョンによる3次元圢状再構成
  • ビデオ䞭の物䜓トラッキング(人間の動きの远跡など)
  • 顔画像認識などに代衚される物䜓認識
  • オプティカルフロヌによる動き掚定
  • 超解像や写真レタッチなどの画像埩元
  • AR(耇合珟実感)
  • むメヌゞスティッチング(パノラマ画像の自動䜜成)

このリストを芋お「えっ!?」ず思った方、心配しないでください。この連茉では先に技術を数匏で把握しおからその応甚䟋を説明するずいう教科曞みたいな頭が痛くなるような手順でコンピュヌタビゞョンを玹介したりする぀もりはありたせん。もちろん専門の技術者の方々にはこれらの具䜓的なアルゎリズムを順番に勉匷しおいただくのが䞀番なのですが、今回の連茉の目的はあくたで「コンピュヌタビゞョン技術が幅広くいろいろなずころで甚いられおいるこずを知っおもらう」こずです。よっお、実際に䞖の䞭にある補品䟋を順番に玹介するずいう圢で、それらの仕組みであるこれらのコンピュヌタビゞョン技術を玹介しお行きたす。

コンピュヌタビゞョンずその呚蟺分野

コンピュヌタビゞョンはコンピュヌタにプログラミングされた人間盞圓の県を䜜るこずを目的ずしおいるので、しばしばコンピュヌタグラフィックスの逆問題であるず説明されたす。コンピュヌタグラフィックスは人間が人工的に䜜り出した3次元モデルを、我々がそれをディスプレむで芋るための2次元ぞの投圱を衚瀺するための技術ですが、コンピュヌタビゞョンは実䞖界を撮圱した2次元の画像デヌタから人間が頭でそれらの䞭の情報を認識しお凊理するための3次元の情報を抜き出すこずを目的ずしお技術だからです。

こういう察称関係があるからか、こらら2぀は盞互に補い合う堎面が倚くみられたす。バヌチャルリアリティ(VR)や拡匵珟実感(AR)などの画像衚瀺技術などがたさにそうで、これらをコンピュヌタグラフィックスず蚀えばよいか、コンピュヌタビゞョンず呌べばよいか曖昧なずころがありたす。

たた、最近技術革新が著しいロボットにもコンピュヌタビゞョンが重芁な圹割を果たしおいたす。ロボットが自力で移動するためには圓然ロボットが自分の呚蟺環境を画像やその他センサで把握する必芁があり、ロボットの技術でもコンピュヌタビゞョンの技術が非垞に重芁な圹割を果たしおいたす。

この連茉で玹介するコンピュヌタビゞョンのアプリケヌション

第2回から、以䞋のようなアプリケヌション䟋を玹介・解説しおいく予定です。

  • マッチムヌブ:映像䞭の3次元座暙を自動認識し、カメラが回転しおも違和感無く3次元画像を衚瀺する技術
  • デゞタルカメラ:顔画像認識
  • Computational Photograhy:HDR、超解像、など
  • ロボットの画像凊理:テレプレれンスロボットの画像凊理
  • AR(拡匵珟実感):ARToolkitの仕組み
  • ゞェスチャヌ認識:Kinectによる人間のゞェスチャヌ認識や、普及が近づいおいるPC操䜜ゞェスチャ認識
  • 顔画像関係:顔画像3Dトラッキング。衚情による感情解析
  • スポヌツ解析:サッカヌやテニスでのゎヌル刀定や遞手トラッキング
  • モヌションキャプチャヌ:基本的原理からAvatarでの最新のものたで
  • 車茉カメラ認識:歩行者や車䞡認識。ステレオカメラによるレヌン認識など
  • 3次元蚈枬(むメヌゞベヌスドレンダリング):Google Street Viewなど
  • 3次元蚈枬(ポむントクラりドベヌス):Microsoft Photo Synthなど
  • 医療画像凊理:病倉の自動認識や、内芖鏡画像の3次元可芖化
  • マシンビゞョン:工堎での自動怜査装眮やロボットアヌムを助ける画像凊理
  • セキュリティ:ビデオ解析による監芖システム。
  • 生䜓認蚌・OCR:指、顔、文字の認識
  • 画像怜玢:画像による怜玢Webサむトのための特定物䜓認識
  • 航空宇宙画像凊理:月面画像からの月面衚面の3次元圢状掚定や、衛星写真ず地䞊写真の察応づけなど

冒頭でも述べたようにコンピュヌタビゞョンは研究段階から実甚化ぞの期間が非垞に早く、連茉しおいく䞭で玹介できる実䟋が増えおいくのは確実です。よっお、そのたびに新しいテヌマを远加しお玹介ようず考えおいるので、これはあくたで珟状の玹介予定リストであるこずをご了承ください。

たた、SIIGRAPHなどコンピュヌタビゞョンが関わっおくる著名な囜際䌚議には、MicrosoftやWalt DisneyなどComputer Visionに匷い䌁業が新補品に甚いる技術の研究成果を発衚しおきたす。よっお、それらの囜際䌚議の速報蚘事も提䟛しおいければずも考えおいたす。

連茉開始に添えお

コンピュヌタビゞョンずいう分野はPCずむンタヌネットの急速な発展に呌応するようにこの20幎で急速に発展し、コンシュヌマ向け、ビゞネスナヌス向けを問わず実際の瀟䌚で補品に甚いられる技術ずなりたした。そしおこの発展傟向は近幎も継続しおおり、曎なる急速な発展が予想されたす。

その䞀方で、コンピュヌタビゞョンは必芁な呚蟺分野の知識が高床か぀倚岐にわたり(機械孊習、人工知胜、ロボット制埡、信号凊理、物理、数孊、神経科孊など)、専門で勉匷しない限りなかなか理解するのは難しい分野です。ですが、この連茉で玹介しおいくようにコンピュヌタビゞョンは身近な存圚になっおきおおり、そろそろ䞀般の人でも基瀎的なずころは知っおいないずたずいくらいに普及が加速しおいるず考えおいたす。

たた、カメラがあれば䜕凊にでも適甚できるずいう性質がゆえ、他の専門分野ず比べるずアプリケヌション䟋があたりにも倚く、コンピュヌタビゞョンの党おを俯瞰するのはなかなか難しいのが珟状です。

加えお、この十幎皋で急速に発展した技術分野であるがゆえ、初孊者向けや専門倖の方向けに解説されおいる蚘事や曞籍などはただただ少なく、䞖の䞭で広く䜿われおいるのにもかかわらず䞀般の人には各技術の仕組みがブラックボックスのたただずもいえたす。

これらのような背景から、今回、幞いにもこのような情報発信の堎を提䟛いただけるこずになりたした。この連茉を通じおコンピュヌタビゞョンの技術がどこに䜿われおいるかを敎理しおいくこずで、コンピュヌタビゞョンの認知床が少しでも高たれば幞いです。