Google Glass

Google Glassは、今幎行われたGoogleの開発者向け䌚議であるGoogle I/O 2012においお、プロトタむプ版を甚いおその開発が倧々的に発衚された「コンピュヌタ搭茉の芖芚拡匵メガネ」ずも蚀える泚目の新技術です。い぀実際に販売され始めるかはただ発衚されおいないのですが、コンピュヌタビゞョンの倧きな応甚ずしお今埌泚目される技術ですので、ご玹介しおおきたす。

Google Glass (出兞:Project GlassのGoogle Plusアカりント)

Google Glassは挫画ドラゎンボヌルの「スカりタヌ」のように、片方の県の先にだけ、各皮情報を重ねお衚瀺させるこずができる透明のディスプレむが搭茉されおいたす。そのディスプレむに映る前方の珟実䞖界䞊に(スカりタヌず同じ甚に)、デヌタや画像などの各皮情報が重ねお衚瀺されるずいうのがGoogle Glassの䞻芁機胜です。぀たりは、Web䞊で共有されおいる沢山の情報を、「拡匵珟実感」によりリアルタむムにディスプレむ䞊に衚瀺するメガネずいえたす。たた、カメラ、マむク、Webブラりザ、音声認識を備えたスマヌトフォン機胜が内蔵されおいたす。Webずは無線により぀ながっおいお、Googleのサヌバから、ディスプレむに衚瀺するのに必芁な各皮情報が送信されおきたり、逆にそれらの情報を匕き出すための各皮情報がGoogleのナヌザヌごずのWebキャッシュを元にサヌバぞ送信されるこずになりたす。

蚀葉だけで説明しおもなかなかどういうものかがわからないず思いたすので、先皋述べたGoogleによるコンセプトムヌビヌを芋おみたしょう。

この動画のように、各皮情報がGoogle Glassのディスプレむ䞊に衚瀺されるずいうものです。これたでもスマヌトフォンのカメラを通しおこのようなリアルタむム情報が衚瀺されるアプリケヌションはありたしたが(䟋:セカむカメラ)、それらずのGoogle Glassの違いは「県で芋おいる芖芚のたた、そこに重ね合わされた情報を芋る事ができる」ずいう事になりたす。わたしたち日本人からするずこれはやはり「スカりタヌ」を連想させたすね。

䞀人称メガネは珟圚ホットな研究トピック

近幎、コンピュヌタビゞョンの研究者の䞭でもこの「䞀人称芖芚(first person vision)」の研究が盛んに行われおいたす。以前は屋倖や屋内のカメラであるずか、運動䌚で埒競走をしおいる息子を撮っおいる映像など、「第3者芖点のカメラ」で撮圱した映像を解析するのが䞻流でした。しかし、HMD(ヘッドマりントディスプレむ)が手にいれやすくなっおきお、そのHMDに関連するVR(Virtual Reality)やAR(Augmented Reality)の技術が急速に発展し、コンピュヌタビゞョンでも芖線远跡技術や物䜓認識技術の発展で䞀人称芖点の映像でも実珟できるこずが倚くなっおきたこずの圱響で、それらをたずめお応甚する『「人間の芖点から芋たそのたたの映像」=「䞀人称芖芚」の研究』が盛んに行われおいたす。

Google Glassはこの䞀人称芖芚の研究の、初めおの倧きな応甚成功䟋になる可胜性がありたす。ただし、珟圚発衚されおいる最初のGoogle Glassの仕様では、映像を解析しおの物䜓認識や人認識による情報衚瀺機胜はほずんどなさそうな暡様で情報を重ねお衚瀺するだけのようです。぀たり、最先端のコンピュヌタビゞョン研究で実珟されおいる䞀人称芖芚システムず比べるず、「ARしか搭茉されおいなくお各皮認識技術は搭茉されおいない」ずいう乖離がありたす。ずはいえ、将来的にこうした䞀人称芖芚メガネが普及したずきに、コンピュヌタビゞョン技術による各皮解析技術が倧きな圹割を果たすのは必至ず思いたす。特にGoogleの堎合は怜玢の䌚瀟ですので、Google Glassに映る実䞖界の物䜓や人からそれぞれ情報怜玢したいはずで、コンピュヌタビゞョンの各皮認識技術を掻甚するこずになるからです。

GoogleのGlassプロゞェクトのプロダクトマネヌゞャであるSteeve Lee氏は「Google Glassは人をその堎その時の珟実に集䞭させる」ず蚀いたす。これたでのコンピュヌティングデバむスは、県ず盎接぀ながっお倖界を芋おいるわけではなくお、あくたでデバむスで衚瀺されおいる画像や動画やそれらが組み蟌たれおいるWebを通しお「埌で」芋おいたわけであり、それはPathやInstagram、Youtubeずいったアプリでも同様でした。たた、スマヌトフォンのカメラ越しにリアルタむムにARが衚瀺されるアプリは既に存圚しおいたすが、県に盎接装着しおメガネずしお䜿うものではなく、あくたで手でスマヌトフォンを掲げおそこにカメラで映し出される映像の䞊にARが映し出されるずいうものでありたした。しかし、このGoogle Glassのような䞀人称芖点によるメガネデバむスでは、「普段目を通しお芖おいる映像の䞊に盎接情報が衚瀺され、芖芚が拡匵される」わけです。぀たり、移動したり䜜業をしたり䌚話したりする時の「珟実」においお圹に立぀のが、䞀人称芖点のメガネデバむスであるわけです。

Google Glassのような「䞀人称芖点メガネ」が普及した堎合の瀟䌚的むンパクト

このGoogle Glassがどういう颚に瀟䌚的むンパクトが高いかに぀いおは、䟋えば次のように蚀えるず思いたす。

「人間が生掻する䞭で芋る"䞀人称映像"に珟れるものであれば、それらをすべおコンピュヌタビゞョン凊理するこずにより、それらを各ナヌザヌが装着しおいるメガネからリアルタむムにデヌタずしお取り蟌み、Web䞊で解析・共有するこずができるこずになる」

䟋えば、Googleは問い合わせた写真䞊に写っおいる物䜓がどういったものなのかを、Googleの特定物䜓認識甚デヌタベヌスから怜玢しお教えおくれる「Google Goggle」ずいう物䜓認識アプリをすでに提䟛しおいたす(Google Goggleを実珟する「特定物䜓認識技術」は、埌にこの連茉でも仕組みを玹介予定です)。しかし、このGoogle Goggleずは違っお、Google Glassでは各ナヌザヌの芖界に入っお来る映像から埗られる情報を次々ずリアルタむムに認識し、サヌバにアップロヌドする「実䞖界分散芖芚センサ」の圹割を担うずいうものに将来的に発展するポテンシャルがありたす。

たたこれは、これたでは手䜜業で集めおいた物䜓認識や顔認識甚の機械孊習甚の倧量の画像デヌタが、各ナヌザヌのカメラからGoogle Glassにアップロヌドされるこずで、それらを甚いお機械孊習するこずにより匷力な物䜓認識゚ンゞンを䜜れる可胜性も瀺しおいるず蚀えたす。そうしお匷化された物䜓認識゚ンゞンや顔認識゚ンゞンなどにより、各Google Glassからさらに安定しお倚くの物䜓や人の情報を取埗できるようになっおいく可胜性があるわけです。

䞀方で、同じくGoogle Glassが発衚された埌に継続しおWebなどで議論されおいるこずなのですが、Google Glassは監芖カメラ技術の文脈などでも話される「過剰監芖瀟䌚」を加速するツヌルになり埗る点が危惧されおいたす。䟋えば将来的にGoogle Glassに顔怜出・顔認識アルゎリズムが搭茉されたずするず、各ナヌザヌが出䌚ったり、街角ですれ違った人間の顔の画像がどんどんGoogleのサヌバにアップロヌドされ、Facebookの顔認識デヌタベヌスの芏暡ずは比范にならないほどの、巚倧な顔認識デヌタベヌスができあがるわけです。顔認識デヌタベヌスの網矅範囲が広くなるだけならただ良いのですが、問題はGoogle Glassは街角の䞍特定倚数の人の顔を捉えるポテンシャルを持っおいる点です。これは、珟状のタヌミナル駅の改札に蚭眮されおいる監芖カメラよりも曎に広範囲においお「倧量の人間の顔画像を映像から取埗しおそれらを巚倧な顔認識デヌタベヌスず照合するこずにより、圌らがどの人物なのかを刀別できるシステム」が「メガネを通しお」蚭眮される可胜性を瀺しおいるわけです。

Webやむンタヌネットを介しお個人情報を取埗するこずでサヌビスをもたらす技術は、Google Glassに限らず必ずプラむバシヌの問題が発生したす。その䞭でメリットずデメリットをうたく捉え、自分が䟿利だずか楜しいず思った堎合はそのサヌビスを頻繁に䜿えばいいでしょうし、デメリットが倚いず思うのであればそれはやめおくれず声を䞊げるこずになるでしょう。Google Glassのような、䞖の䞭の仕組みを盞圓な芏暡で倉えるポテンシャルのある技術の堎合は、その技術がどのくらい䞖の䞭に浞透しおいるかによっおも、メリットずデメリットの重なり具合や絶察量が倉わっおきたす。新しい技術が浞透しお䞖の䞭が倉わるず、新しいルヌルや垞識の元で䟡倀芳を構築しなおす必芁があるのが人間瀟䌚だず思いたす。Google Glassのような拡匵メガネが発売されお普及した時に、この連茉で玹介しおいる各コンピュヌタビゞョンの技術の仕組みが、それら新技術の䟡倀を自分の頭で刀断する助けになれば幞いです。

今回のたずめ

前回、今回ず2回に分けおGoogle X研究所による2぀の研究プロゞェクトを玹介したした。2぀のプロゞェクトリヌダヌでSebastian Thrun氏の専門は人工知胜ですが、人工知胜やロボット分野においお、芖芚を蚈算機で凊理する「コンピュヌタビゞョン」が掻躍しおいるこずがわかっお頂けたかず思いたす。

むンタヌネット/スマヌトフォン瀟䌚がさらに加速的に進展しおきおいる珟圚、実䞖界の芖芚情報を取埗できるコンピュヌタビゞョンの技術は、近い将来に非垞に重芁な圹割を果たし、か぀䞭心的な技術になるず筆者は確信しおいたす。なぜなら、我々が普段県で芋おいる䞖界から、24時間継続的に色々な情報を認識しお取埗できるからです。したがっお、専門の方だけでなくできれば䞀般の方でも、そういう技術がある、ずいうこずを知っおおくだけでも受ける印象が倉わっおくるはずです。

そういった意味では、これたではい぀も難しいアルゎリズムの話ばかりしおいるずいう印象を持たれおいた方もいらっしゃるかもしれたせんが、今埌は今回のような他分野でどうコンピュヌタビゞョンが応甚されおいるかに぀いおも玹介しおいきたいず思っおいたすので、それを通じお、コンピュヌタビゞョンを身近に感じおもらえるず幞いです。