GTC 2016 - なぜNVIDIAはディープラーニングに注力するのか

AI開発の陰の主役「GPU」

GTC 2016の主要テーマは「ディープラーニング」である。売り上げからいけば、ゲーム用のGPUの方が多いのであるが、NVIDIAは自動車の運転サポートなども含めたAIは、近い将来GPUの売り上げに大きな比重を占めると見て、力を入れている。

まだ始まったばかりであるが、すでにディープラーニングは、インターネットやクラウド、医薬やバイオ、メディアや娯楽、セキュリティ、自律的に動く各種の機械に用いられている。また、碁で世界でもトップレベルのプロを破ったというニュースは記憶に新しい。

すでにディープラーニングは、インタネットやクラウド、医薬やバイオ、メディアや娯楽、セキュリティ、自律的に動く各種の機械に用いられている

従来の画像認識は、積み重ねられたさまざまなアルゴリズムがあり、それらを熟知した画像認識のエキスパートがそれらのアルゴリズムを組み合わせて、目的とする認識が行えるシステムをくみ上げていた。しかし、この方法では画像認識のエキスパートが必要であり、開発時間も長くかかっていた。

ディープラーニングを使うと、ニューラルネットが大量の入力データから特徴を学び、認識ができるようになる。画像認識のエキスパートは必要ないが、その代わり、大量の入力データと学習のための大量の計算が必要となる。

ディープラーニングでは、画像認識のエキスパートは必要ないが、その代わり、大量の学習データとそれを学習するための大量の計算が必要となる

また、「ILSVRC(Image-net Large Scale Visual Recognition Competition)」というコンペでは、次の左端の図でオレンジの点で示されたものがディープラーニングを使う認識で、2012年にHinton教授のグループのAlexnetが圧倒的な好成績収めて以来、殆どのチームがディープラーニングを使う方式になり、従来の画像認識のテクニックでは、まったく太刀打ちできないという状態になっている。

左はILSVRCの参加チームの画像認識率の2010年以降の推移。右はWatson、Baidu Deep SpeechなどAI関係の主要なイベントの写真

そして、IBMのWatsonは自然言語の理解にブレークスルーを実現し、Facebookはディープラーニング処理向きのBig SurサーバをOpen Computeで公開し、Baiduは喋られた言葉を理解するBaidu Deep Speech 2を運用している。Googleはニューラルネットを開発するツールであるTensorFlowをオープンソースで公開し、トヨタはAI研究所を設立し、AIの研究開発に10億ドルを投じると発表した。また、Microsoftと中国の科学技術大学は、4～5行の短文を読ませ、質問文がその文と論理的に整合するか、矛盾するか、どちらとも言えないかを答えるタイプの知能テストで、人間の平均点を上回るディープラーニングシステムを開発した。このように、至る所でAIの開発レースが始まっている。