現在、IT業界のみならず、さまざまな産業界で最もホットな話題のひとつである「人工知能(AI)」。かつてSFの夢物語だった「考える機械」が、今、さまざまな産業界において、急速なピッチで現実のものになろうとしている。人工知能の進化の裏には、技術面での進化が欠かせないものだった。

人工知能のレベルを引き上げた「ディープラーニング」

人工知能というと、映画「2001年宇宙の旅」の「HAL」のように人類に反乱を起こすちょっと危険なコンピュータ、あるいは「鉄腕アトム」や「ドラえもん」のように人間臭い感情を持ったロボットのことを思い出す人が多いのではないだろうか。現実の人工知能はこういったレベルには達しておらず、画像認識や音声認識など、限られた処理において、「人間が正確に条件を入力しなくても、自分で推測して答えを導き出す」という程度のものにすぎない。しかし、技術の進歩に伴い、その精度と速度は人間を上回るものになろうとしている。

たとえば、画像の中に何が写り込んでいるかを見つけ出す画像認識については、2011年ごろまでは「機械学習」という手法で鍛えられた人工知能は長年、80%程度の正答率を超えることができなかった。しかし2012年に新しい処理方法「ディープラーニング」を使って鍛え上げた人工知能が国際的な画像認識コンテスト「ILSVRC」で前年を大きく下回る誤認識率となった。人間の誤認識率は約5%とされており、2015年にはついに人間を上回る精度を実現している。

画像左:ディープラーニングにより画像認識の精度が上昇、画像右:国際的な画像認識コンテスト「ILSVRC」における画像分類テストの誤認識率。2012年を境にエラーが減っていることがわかる(NVIDIA Deep Learning Day 2016講演資料より)

機械に、人間のように「自分で判断し、自分で答えを見つけ出す」機能を実現させようという試みは、実は1940年代にはスタートしている。「ニューラルネットワーク」という人間の脳の神経伝達を模倣したモデルのうち、最初期の手法である「パーセプトロン」が、最初の学習機能を持った人工知能として登場した。しかし、このパーセプトロンでは解決できない問題が生じてしまった。やがて、「隠れ層」と呼ばれるものを加えた新たなモデルが登場することが問題解決の糸口となったが、十分な精度をもたらすための莫大なデータと、それを現実的な速度で処理する処理速度がなかったため、2000年代にいたるまで人工知能の進化は限定的なものだった。

2000年代に入りインターネットの普及で、学習に利用できる莫大なデータが容易に入手できるようになり、一気にニューラルネットワークを使った研究が進むようになる。特に数段階以上と深い階層を用いるニューラルネットワークを使った学習を「ディープラーニング」(深層学習)と呼ぶようになり、これがそれまでの限定的な浅い階層しか持たない人工知能との決定的な差を生むことになった。

人間の神経伝達をモデル化したものがニューラルネットワーク。それを多層構造にしたものが上記のディープニューラルネットワークであり、これを利用した学習がディープラーニングとなる(画像はGoogle I/O 2015より)