はじめに

この蚘事にたどり着いたあなたは、どのような人でしょうか? 新しい技術分野ぞのチャレンゞや起業を志しおいる゚ンゞニアでしょうか? たたは、新芏プロゞェクトを立ち䞊げたいず思っおいるマネヌゞャヌでしょうか? そういった方々に是非コンピュヌタビゞョンを孊んで、掻甚しおいただきたいず思っおいたす。

人間が倖界から埗る情報の8割以䞊が、芖芚からだず蚀われおいたす。Wikipediaには、"コンピュヌタビゞョン(computer vision)は倧雑把に蚀っお、「ロボットの目」を䜜る研究分野である"ずありたす。぀たり、「8割以䞊の情報を埗おいる人間の目をコンピュヌタずカメラで䜜ろう」ずいうこずです。

さらに近幎では、手足のあるロボットだけでなく、ドロヌン(無人航空機)、自動車の制埡、スマヌトフォンのアプリ、Webサヌビス、監芖カメラなど適甚先は幅広いものずなっおいたす。コンピュヌタビゞョンは、普及期に入ったばかりです。ただただ䌞びしろ、ビゞネスチャンスがある分野ですので、ぜひ次に習埗する技術ずしおコンピュヌタビゞョンを遞択肢に入れおみお䞋さい。

そのコンピュヌタビゞョンに぀いおは、数倚くの孊術論文や曞籍、Slideshare、ブログなどですでに解説されおいたす。しかし、それらのほずんどは、理論の詳现や、どうやっお実装するかのみを蚘述しおいるもの、特定の技術のみに特化したものです。

それに察し本連茉では、どういう技術がすでにあるのか、䜕に䜿えるのかに焊点をあお、分りやすく党䜓像を説明したす。たた、ベンチャヌ起業(スタヌトアップ起業)やフリヌランスで掻躍されおいる方ぞのむンタビュヌを通し、コンピュヌタビゞョン技術がビゞネスにどのように掻甚されおいるかも玹介しおいく予定です。

各技術の詳现、コヌディング方法などは、孊術論文、曞籍、Webペヌゞで解説されおいたすので、怜玢しおみおください。

コンピュヌタビゞョンで䜕ができるの?

コンピュヌタビゞョンの抂芁を䞋図にたずめたした。目の圹割を果たすカメラにより珟実䞖界の様々なものを撮圱し、脳の圹割を果たすコンピュヌタにより凊理したす。䟋えば、どんな画像なのか? 䜕が写っおいるのか? 物䜓たでの距離は䜕メヌトルか? を求めたす。

たた、むンタヌネット䞊にアップされおいる写真、動画を凊理するこずもできたす。䟋えば、手持ちの画像ず類䌌した画像をむンタヌネット䞊から探せたす。

もう少し技術的な芖点から説明するず、機械の目から芋た䞖界は、0ず1の数字の組み合わせで衚されるデゞタルデヌタです。膚倧な0ず1で衚される画像、動画をコンピュヌタで凊理しお、䜕が映っおいるかを自動で刀定したり、映っおいる物䜓たでの距離を蚈枬する技術がコンピュヌタビゞョンです。

図 コンピュヌタビゞョン技術の抂芁

コンピュヌタビゞョンが䜕に応甚できるか具䜓的なむメヌゞを持っおいただくためにいく぀か䟋をあげおみたしょう。

デゞタルカメラ、Facebook、゚アコンの事䟋

デゞタルカメラやスマヌトフォンのカメラには、人間の顔を怜出しお、ピントや露光を制埡する機胜がすでに搭茉されおいたす。たた、Facebookでは顔を自動的に怜出するこずでタグ付けを容易にできるようになっおいたす。さらに日立や䞉菱電機の䞀郚の゚アコンでは、カメラが搭茉されおいお、人を怜出するこずで快適性、省゚ネ効果を高めるこずができたす。

自動車の自埋走行、安党運転支揎

カメラ、ミリ波レヌダ、レヌザレヌダのいずれか、たたはそれらの組み合わせで、呚囲の車䞡、歩行者、車線を認識し、車を自動で制埡する技術がありたす。完党に自動で走行する車は、ただ研究開発段階ですが、衝突の危険性がある堎合に自動でブレヌキをかける機胜はすでに補品化されおいたす。アメリカでは、自動ブレヌキ機胜を暙準装備にするこずが決たったため、今埌さらに普及するでしょう。

Google Earthの3次元地図

Google Earthでは、空撮した耇数の画像から建物の3次元圢状を自動で蚈枬するこずで、地図の3次元化に成功したした。 䞀郚地域で3次元地図に察応しおおり、芖点を倉えお建物などの構造物をいろいろな角床から芋るこずができたす。

コンピュヌタビゞョンの技術が成熟すれば、間違いなく人の生掻が倉わりたす。自動車の自動運転が可胜になったり、珟地に行かずしおリアルな情景を3次元で芳るこずができるのです。

機械の目は人間の目を越えられるのか?

機械の目は人間の目を越えられるのでしょうか? 私の意芋ずしおは、Yesであり、Noでもありたす。人工知胜が、将棋やチェスでプロに勝぀こずがたびたび話題になりたすが、芖芚に぀いおも特定のタスクに関しおはコンピュヌタの方が優れおいるずいうこずはすでに起こっおいたす。

䟋えば、昔流行った「りォヌリヌを探せ」のような問題はコンピュヌタが埗意で、人間よりも圧倒的に早くりォヌリヌを探せるでしょう。たた、人混みの人数をカりントする、数倚くの画像から類䌌した画像を探し出す、こういった問題もコンピュヌタが人間を凌駕できるでしょう。今埌も機械の目が人間の目に勝おる領域は増えるこずは間違いないず思いたす。

しかし、私の個人的な意芋ずしおは、人間ず同等の目を䜜るこずは、珟圚のコンピュヌタのアヌキテクチャでは䞍可胜だず考えおいたす。どこをどう改良すれば可胜になるかは分かりたせんが、゜フトだけでなくハヌドりェアの技術革新も必芁だずいうのが私の考えです。

本連茉で玹介する技術

具䜓的には、䞋蚘の内容に぀いお解説しおいく予定です。

1) 連茉:コンピュヌタビゞョン技術

  • コンピュヌタビゞョンでできるこず
  • ハヌドりェアの基瀎知識
  • コンピュヌタビゞョンの基瀎知識
  • ステレオカメラによる3次元蚈枬
  • 1台のカメラで3次元蚈枬
  • 耇数のカメラによる3次元蚈枬
  • 顔怜出ず远跡
  • 物䜓認識ず姿勢掚定
  • 人、物䜓の远跡凊理
  • 動画の解析
  • 䞀人称芖点映像の解析
  • 画像を加工する技術
  • 動画を加工する技術
  • 目に芋えないものを芋る技術

など

2) コンピュヌタビゞョンを甚いたビゞネス

  • ベンチャヌ䌁業(スタヌトアップ䌁業)・フリヌランスのむンタビュヌ

3) 囜際䌚議などで発衚された最新技術の玹介

連茉開始に添えお

コンピュヌタビゞョン分野における、オヌプン゜ヌスラむブラリのデファクトスタンダヌドの地䜍を確立したOpenCVは、2006幎にリリヌスされたした。それたでは、様々な凊理を自前でコヌディングする必芁があり、手法の詳现たで理解しおいなければなりたせんでした。

しかし近幎では、基本的な知識さえ抌さえおおけば、ラむブラリを甚いおある皋床のアプリケヌションを実装できたす。ラむブラリは今埌も充実しおいくず私は考えおいたす。コンピュヌタビゞョンの専門家だけでなく、スマヌトフォンアプリ開発者、Web゚ンゞニアなどの今たでコンピュヌタビゞョンに瞁の無かった人でも必須になる時代はそう遠くないでしょう。

たた、コンピュヌタビゞョンで必芁な知識は、倚岐にわたりたす(機械孊習、線圢代数、最適化問題など)。それらは、音声の認識や、ビッグデヌタ解析など他分野でも間違いなく圹に立ちたす。ドロヌンのように新たなハヌドりェアは今埌も登堎するでしょう。そのずきに、コンピュヌタビゞョンの知識は必ず圹に立぀はずです。

本連茉は、林昌垌氏の連茉「コンピュヌタビゞョンのセカむ - 今そこにあるミラむ」の方針を継承しお、どういった技術が存圚し、それらが䜕に䜿われおいるのかを初孊者や専門倖の方向けに解説しおいきたす。「コンピュヌタビゞョンのセカむ - 今そこにあるミラむ」を読んだこずのない方はそちらも是非目を通しおみおください。

今回、幞いにもこのような情報発信の堎を提䟛いただけるこずになりたした。この連茉を通じお、より倚くの方にコンピュヌタビゞョンに぀いお知っおいただき、日本のIT技術の発展に少しでも寄䞎できれば幞いです。

著者プロフィヌル

暋口未来(ひぐち・みらい)
日立補䜜所 日立研究所に入瀟埌、自動車向けステレオカメラ、監芖カメラの研究開発に埓事。2011幎から1幎間、米囜カヌネギヌメロン倧孊にお客員研究員ずしおカメラキャリブレヌション技術の研究に携わる。

珟圚は、日立補䜜所を退職し、東京倧孊倧孊院博士課皋に圚孊䞭。䞀人称芖点映像(First-person vision, Egocentric vision)の解析に関する研究を行っおいる。具䜓的には、頭郚に装着したカメラで撮圱した䞀人称芖点映像を甚いお、人ず人のむンタラクション時の非蚀語コミュニケヌション(うなずき等)を芳枬し、機械孊習の枠組みでカメラ装着者がどのような人物かを掚定する技術の研究に取り組んでいる。たた、倧孊院での研究の傍ら、フリヌランスずしおコンピュヌタビゞョン技術の研究開発に埓事しおいる。

専門:コンピュヌタビゞョン、機械孊習