急ピッチでTensor Processing Unit(TPU)の開発を進めるGoogle(3) 最新のTPUを活用することで強くなっていったAlphaGo

AlphaGoは最新のTPUを使っている

Google DeepMindのAlphaGoが2015年10月に囲碁の元欧州チャンピオンを破ったときには、CPUやGPUを使う普通のサーバを使っていたと思われるが、2016年3月の韓国のトッププロ棋士の李世乭九段を4勝1敗で下したときには前回掲載した写真のTPU1を搭載したサーバ群を使い、大幅に強さを増していた。

人間であれば、半年足らずの間で、大幅に強くなることはあまり無いと思うが、ニューラルネットの場合は、アルゴリズムや学習の改善もあり得るし、単に高性能のTPUを多数使って推論性能を大幅に引き上げることでも強くできる。Google DeepMindとしては、李世乭九段との対戦を前に、勝てるレベルまでAlphaGoのElo ratingを引き上げて試合に臨んだと考えられる。

また、今回の世界ランキング1位の柯潔九段を3戦全勝で破った試合では、こちらも前回掲載のTPU2を使ったシステムを使っている。TPU2では学習もできるようになったので、AlphaGo同士で対戦させて行う強化学習にかかる時間が短くなり、より強くなったのではないかと推測される。

なお、囲碁にはElo Ratingという対戦成績を統計的に処理して、数値で強さを表すランキングがある。最近のElo ratingでは、AlphaGoが3612で1位、今回、敗れた中国の柯潔九段は3608で2位、李世乭九段は3557で4位、日本の井山裕太九段は3532で5位となっている。

2017年5月に行われた柯潔九段とAlphaGoとの対極の様子 (出所:AlphaGo Webサイト)

Google DeepMindの創立者でAlphaGoを開発したDemis Hassabis氏は、AlphaGoの開発はこれで終了し、今後はより実用的な問題の解決に取り組むと述べている。

GoogleはクラウドTPUをユーザに提供する

Googleは、現在のところはTPUやTPUを使った開発システムを販売する意図は無さそうであるが、クラウド上でのサービスとしてTPUをユーザに使わせる。まず、アルファプログラムとして、1000個のTPU2を研究者に無償で提供する。

その先、どんなビジネスを見込むのかに関しての公表情報は無いが、アルファプログラムの開発成果は原則公開であるので、多くのAIアプリケーションがGoogleに集まることになると予想される。

そうなると、TensorFlowで書いたニューラルネットの処理をクラウド上のTPU2で処理するサービスを、有償で一般ユーザに提供したり、そのAIアプリでビジネスを行う会社に有償でTPU2を使わせたりすることは、充分、考えられる。Googleは、クラウド上でTPU2を提供するというビジネスも視野に入れて、TPU2では学習もできるようにしたのではないかと思われる。