GTC 2018 - 基調講演でCEOが示したこれからのAIのためのハードウェア

Jensen Huang CEOの独壇場となったGTC 2018

GTCにて基調講演を行うJensen Huang CEOの写真を、毎年見て、気が付かれている方もおられるのではないかと思うが、今年も恒例の黒い革ジャンで登壇した。毎年、デザインは違うようで、Jensenのクローゼットには、革ジャンが何十着も溜まっているに違いないという噂は聞くが、見たという話は聞かないので、本当のところは分からない。

トレードマークの黒い革ジャンで基調講演を行うNVIDIAの創立者&CEOのJensen Huang氏

また、Jensenは、例年、基調講演は120%務めるのであるが、その後のQ&Aは部下の幹部に任せる。今年も幹部がひな壇に並んで、Q&Aは例年のスタイルと思っていたところに、突如、Jensenが登壇して独り舞台で喋り始めた。20～30分ほど、AIに関する自説などを喋り続けて引っ込んだが、幹部は毒気を抜かれ、一問、二問、会場からの質問に答えたが、それだけで、基調講演に関するQ&Aは終わってしまった。

さらにこれで終わりと思っていたら、夕方に開催された注目アイデアのスタートアップを選んで表彰するInception Awardの表彰発表にも同氏は登壇するなど、精力的な姿を見せた。Inception Awardはヘルスケア、企業、自律システムの3分野それぞれで最優秀スタートアップを選ぶもので、今年は、約200社が応募したとのことである。受賞者には100万ドルのの賞金が与えられるので、財政的に余裕のないスタートアップには魅力的な賞である。

この登壇も飛び入りと思われるが、会場にいた共同創立者のChris Malachowsky氏を壇上に呼び上げ、NVIDIAの創立時代にビジネスプランを要求されたが、ついに作れなかったとか、いざ、上場となった時に、Intelがグラフィックスに進出という話が流れ、得意の絶頂という状況から、一気に倒産の窮地に追い込まれたとか、スタートアップはそんなものだとか、奔放に話を繰り広げていた。

1日に3回もJensen Huang氏が登壇して、こんなにも自由に喋るのを聞いたのは初めてなことである。よっぽど時間に余裕があったのか、それとも気分が良かったのか、あるいはその両方であったのであろう。

GTC 2018で発表された新製品/新技術

閑話休題で、基調講演に話を戻すと、今回発表されたハードの新製品はリアルタイムレイトレーシングができるQuadro V100 GPUのHBM2メモリを32GBと倍増したモデルと、そのV100 GPUを16台へと搭載数を倍増させた「DGX-2」といったところである。また、自動運転用に2個のXavierと2個のVolta GPUを搭載する「Pegasus」と、Pegasusを1チップ化する「Orin」というロードマップも示された。ということで、ハードウェアの新製品という点では、多少、寂しい発表であった。

一方のソフトウェアでは、2個のGV100を使ってリアルタイムレイトレーシングを可能にする「NVIDIA RTX Technology」が発表された。映画では、何時間ものレイトレーシング計算を行って1画面の生成することは以前から行われており、GPUハードの性能が上がれば、そのうちにはレイトレーシングをリアルタイムで実行できるようになるのは、ある意味、当たり前ともいえる。しかし、ついに毎秒30フレームの4Kレイトレーシング画像が、リアルタイムで生成できるようになったのは画期的である。

リアルタイムレイトレーシングを行うQuadro GV100とNVIDIA RTX Technologyを発表するJensen Huang CEO

新たなハードウェアがAIにもたらす効果

V100 GPUに搭載されるHBM2 3D積層メモリを4スタックの4GB品から、8スタックの8GB品に交換してデバイスメモリを16GBから32GBに拡張した製品が発表された。従来、16GBのメモリに格納できない問題については、細切れにして処理する必要があり、データの転送回数が増えて性能が下がってしまうというケースがあったが、その限界が32GBに広がったこととなる。

さらに、18ポートのNVLinkスイッチを新開発し、このスイッチを12個使用して、2台のDGX-1のGPU間を結合した形のDGX-2が発表された。16個のV100に接続されたHBM2メモリ全体が1つの大きなメモリとして使えるようになる。これで以前の16GBのV100×8個の時の4倍の512GBのメモリが使えることになる。そして、Tensorコアを使う混合精度演算では2PFlopsという圧倒的な性能を持つディープラーニング用GPUとなる。

16個のV100 GPUをスイッチで結合するDGX-2について説明するJensen Huang CEO

この結果、「FAIRSEQ」というネットワークの学習にはDGX-1では15日かかっていたが、DGX-2では1.5日で終わることができ、10倍のスピードアップとなったという。計算能力は2倍にしかなっていないので、GPU間のメモリ転送の処理時間が長い処理のようである。DGX-2は、2018年第3四半期に提供が開始され、その値段は39万9000ドルと発表された。

また自動車用では、過去にParkerからDRIVE PX2を作り、それを1チップ化してXavierを作ったのと同様に、現在のXavierに対して、Xavier 2個とVolta GPU 2個で構成されるPegasusを開発し、その次はPegasusを1チップ化するOrinを開発するというロードマップが示された。ただし、ロードマップには時間軸は入っていないため、実現の時期については不明である。

GTC 2018で発表された自動車用コンピュータのロードマップ

このほか、いかにして自動運転の走行距離を伸ばすかという問題に対応するため、「NVIDIA DRIVE SIM」と「Constellation」が発表された。NVIDIA DRIVE SIMは自動走行車を実際に走らせることなく、記録や合成した道路の走行をシミュレートするものである。実際にはまれな危険な状況を再現して車を走らせることもでき、テストの密度を上げることができる。また、Constellationは、1万台のGPUベースのシミュレータで、これを使えば、年間30億マイルの走行が可能になるとのことである。