新年の幕開けに、パーソナルコンピュータのハードウェア技術の動向を占う「PCテクノロジートレンド」をお届けする。本稿はGPU編として、GeForce擁するNVIDIAと、Radeon擁するAMDの動向を探るが、2020年はいまだに謎に包まれているIntelのX^e(Xe)のアンベールも期待される。まとめて紹介したい。

***

◆NVIDIA GPU

  • Photo25: なぜかこの位置が好きなまめっち。時々はキーボードと(左に見えている)モニターの隙間に挟まったりしている。
    (編集注:「PCテクノロジートレンド」では例年、記事中に度々猫が登場します。これは単に猫が好きというだけではなく、著者の助手(?)の猫たちが仕事を手伝う(?)様子を適宜差し込むことで、閑話休題的に話題を区切るという猫大好きな記事構成上の演出です)

2019年はTuringをベースとした製品をコンシューマ向けに展開した1年であったが、さて2020年は? という話。先ほどProcessの所でもちょっと触れたが、NVIDIAはAmpereというコアを開発中である。これがTuringの後継になるのか、Voltaの後継になるのかはNVIDIAは公式には明かしていないが、筆者はVoltaの後継となると判断している。理由は2つある。

一つは先にProcessやCPUの所でも触れたが、2020年内に納入されるNERSCのPerlmutterに、Volta-Nextが搭載される事だ。Voltaそのものは2017年の投入だから、さすがにそろそろ古い製品であり、微細化でシェーダの数を増やし、性能を引き上げたいところである。PerlmutterではCPU/GPU比が1:4となる形でシステムが構築され、CPU/GPUでの合計性能が現状のCoriの2~3倍(60~90PFlops)程度の性能を出す、とされている。CoriがDual Xeon E5-2698 v3×2388node+Single Knight Landing(Xeon Phi 7250)×9668nodeという構成であり、恐らくPerlmutterはSingle Millan+4×Volta-nextというnodeが2000程度で構成されるものと考えられる。Milanの性能をとりあえず無視して考えると、8000枚のVolta-nextで60~90PFlopsを実現するためには、7.5~12.5TFlopsの性能が必要となる。VoltaベースのTesla V100の場合、メザニンカードでBoost Clockだと7.45TFlopsなのでぎりぎり下限に間に合う計算だが、実際には連続使用だとここまで動作周波数が上がらないだろう。となれば、7nm世代に移行して、ダイサイズの小型化とシェーダの増量、消費電力の削減を狙うのは当然の事である。現状のGV100ダイは815平方mmという巨大なもので、これを500平方mm台に抑え込むだけでもかなりコストが下がり、Yieldの改善になるだろう(ついでに若干シェーダ数も増やせる)。

もう一つの理由はコード名のAmpereである。Volta(イタリアの物理学者のIl Conte Alessandro Giuseppe Antonio Anastasio Volta。電圧の単位のVoltは、Voltaにちなんだもの)とAmpere(フランスの物理学者のAndre-Marie Ampere。電磁気学の創始者のひとり。電流の単位のAmpere(アンペア)は、Ampereを英語読みしたもの)という、電磁気学に関係する名前がつけられている辺りに、NVIDIAの強い意図を感じる。Turingは計算機学者のAlan Turingから取られたコード名だから、ちょっと毛色が違うというか、方向性が違っているからだ。こういうコード名の付け方をする場合、AmpereはVoltaの後継と考えるのが自然で、Turingの後継とは考えにくい。

現時点でVoltaとTuringのアーキテクチャ上での最大の相違は、RTCoreを搭載するか、FP64 Unitを搭載するかである。Teslaの用途に今のところRTCoreは必要ない(勿論Ray Tracingを行うという用途はあるが、プロ向けの場合にRTCoreはPreviewには便利かもしれないが、出力生成には十分とは言えない)。逆にGeForceにFP64は必要ない。RTCoreとFP64の両対応のUnit、なんてものが効率よく実装できれば両者は一本化できるかもしれないが、今のところそういう話にはなっておらず、なのでAmpereはTeslaと、あとは超ハイエンドにあたるTitanの後継(さしずめTitan Aあたりだろうか?)に使われる程度に終わりそうだ。このAmpere、恐らくは3月にサンノゼで開催されるGTC 2020でお披露目され、今年後半から出荷開始という感じになるかと思われる。

ではTuringの後継は? というと、恐らくこちらも運が良ければ今年中に後継製品が出てくる可能性はある。先にSamsungのProcessの所で、2019年中にTape outしたのは2製品で、恐らくAmpereのほか、Xavierの後継だろうという予測を書いた。これに続く製品のTape outは2020年に予定されており、なので製品投入は2021年になると考えられる。ただ、これはSamsungの7LPPを使った製品の話である。

Tom's Hardwareの7月2日の記事では当初、The Korean Herald紙が次世代GPUの製造をTSMCからSamsungに移動したと報じたが、その後7月5日にNVIDIAのDebora Shoquist氏(VP of operations)からの「NVIDIAは次世代GPUの製造にTSMCとSamsungの両方を利用する」というメッセージを追記している。元々GeForceの製造ラインに関しては、ハイエンドはSamsungの7LPPを、メインストリーム~ローエンドにはTSMCの(恐らく)N7+を利用するという計画が伝えられており、これが間接的にではあるが追認された形だ。こちらのTape outの時期ははっきりしていないし詳細も不明ではあるが、TU106/TU116あたりの後継がTSMC製造のものになるのではないかと筆者は考えている。こちらは順調であれば、2020年第3四半期中にはリリースされるかもしれない。一方でTU102/TU104の後継に関しては、運が良ければ年内というあたりで、潤沢に出回るのは2021年に入ってからになるかもしれない。実のところAMDがまさにTU106/TU116のマーケットで競争を仕掛けている一方、TU104/TU102のマーケットは今のところ安泰であり、ここに急いで製品を投入する必要は「今のところ」無い。「今のところ」というのは、AMDの次の製品がこのマーケットに投入されないとは限らないからだ。万一、TU102/TU104と競合するような製品を投入してきた場合には、これに対抗する必要がある。ただその可能性がどこまであるか? を考えた場合、当面はTU102コアをベースにOverclockなりMemory速度変更(14Gbps→15.5Gbps)なりを掛けたバージョンで対抗させておき、2021年に後継製品で圧倒する、といったシナリオの方が現実的に思える。