NVIDIAの2017年は、"Volta"の年ではあったのだが、それはTeslaとデスクトップ向けハイエンドの極一部に留まり、結局Pascalベースでのラインナップが維持された。

とはいえ、GP102コアのTitan XpとGeForce GTX 1080 Ti、GP104ベースのGeForce GTX 1070 Ti、それに(OEM向けではあるが)GP108コアのGeForce GT 1030なども加わりトップエンドからローエンドまで完全にPascalでラインナップが完成、バリエーションに富んだ製品群がそろったことになる。

これに加えて、GV100コアを流用したNVIDIA Titan Vも発表されており、米国などでは出荷が開始されている。まぁこのTitan Vをはじめとして、GeForceではクラウドでの利用がサポート外となり、EULAの変更などもあってちょっと騒ぎになったりしているが、とりあえずロードマップには関係無いので今回は割愛する。

  • 一見仲が良さそうに見える

    一見仲が良さそうに見えるが、まめっちの後脚が全てを物語っている

メインストリームに「Volta」はこない

目下の問題は「2018年のラインナップ」である。VoltaのGeForce向け、つまりGV104とかGV106といったコアが出るかどうかであるが、これは完全に無くなっている。というか、そもそもどの程度まで検討したのかも怪しい。

理由は簡単で、端的に言えばPascal+Tensor Core=Voltaだからだ。Tensor Coreはゲームプレイの役には立たないから、これを抜いてしまうとただのPascalそのままでしかない。Tensor Coreを入れた状態だとダイサイズの割に、コンシューマ用途では無駄に性能の低いコアができ上がってしまい、効率が悪いことになる。

PascalベースのGP100とVoltaベースのGV100のスペックを比較してみると、以下のようになる。

GPUコア GP100 GV100
製造プロセス 16FF+ 12FFN
ダイサイズ(mm^2) 610 815
トランジスタ数 153億 211億
SM数 60 80
SM当たりのダイサイズ(mm^2) 10.17 10.19
1億トランジスタ当たりのダイサイズ(mm^2) 3.986 3.863

12FFNはProcessの所で説明した、16FF+に6Track Library(なのかTurbo Cell Libraryなのかハッキリしない)を組み合わせたNVIDIAのスペシャルである。16FFC→12FFCと同等の効果があるとすれば、Turbo Cell Libraryだと10%位のエリア面積削減が可能である。

実際に1億トランジスタ当たりのダイサイズを見ると、4%程度の削減でしかないが、そもそも試算がラフ(パッド面積とかを無視して、ダイ全体がトランジスタで埋められている前提)なことを考えると、確かにプロセスの変更でダイそのもののスリム化は実現できているっぽい。ただその分を埋めて余るほど、SMあたりのダイサイズが増えているというのは、Tensor Coreを追加したためと考えられる。

要するにVoltaのままだと、12FFNを利用しても、16FF+を使うPascalよりもダイが大きくなるという事態から逃れられないということだ。NVIDIA Titan VはGeForce Titan XPを上回る性能を叩き出しているが、これはSM数を80に増やした効果であって、SM数が同じなら性能はPascalと変わらないだろう。

これがノートPCまで含むすべてのマシンでTensor Coreを使うというアプローチにするのであればまだ意味はあるが、Tensor Coreは事実上Teslaグレードの製品を前提にした使い方になっており、その意味でもVoltaをデスクトップに持ち込む意味は皆無である。

当面はPascal Refreshがメイン

ではどうするか? という話だが、当面はPascal Refreshがメインになると思われる。ほぼGeForce 10シリーズと同じラインナップながら、微妙に速度を引き上げたものがGeForce 20シリーズとして投入されるはずだ。ダイそのものはPascalのままなので、メモリも引き続きGDDR5及びGDDR5Xを利用することになるだろう。

というのは、上で書いた通りプロセスを16FF+から12FFNにしても、それで節約できるダイエリアは10%に満たない(せいぜい5%)程度だからだ。

5%というのは60SMが63SMに、あるいは40SMが42SMに増やせる程度で、確かに性能は増すだろうが、大きな性能の改善とは言いにくい。少なくとも物理設計をやり直すコストに見合うほどの性能改善ではない。大きなジャンプは当然次の7nm世代待ちということになる。

ここで気になるのは7FFなのか、7FF+なのかという話だ。コンシューマ向けのGeForceの場合、製造原価の上昇は非常にクリティカルである。そのため、量産は7FF+世代になるのではないかと思われる。

ただそれだと時間が空きすぎるので、ハイエンドにあたる製品(GP104の後継)だけは、7FFで製造するかもしれない。7FFを利用するとすれば、量産開始は2018年第1四半期中、量産シリコンが出てくるのが第2四半期末、製品投入が第3四半期というあたりか。

運がよければCOMPUTEXでサンプルが見られるかも(まぁその前にGTC 2018で何かアナウンスをしそうだが)という感じだろう。

7nmの"Ampere"はどうなる?

その次、つまり7nmを使ったコアは"Ampere"というコード名らしい。アーキテクチャは全く不明のままである。ただ暴論で言えば、PascalコアからFP64のサポートを外すだけで更にSMあたりのエリアサイズが小さくなるので、これと7nmを組み合わせることでPascalと同じダイサイズでSMの数を2倍以上(4倍までは行かないが、3倍前後?)まで増やせることになる。この場合、メモリはGDDR6を利用することになるだろう。

読めないのはこのAmpereコアをGeForce 20シリーズで出すのか、それとも30シリーズで出すのかである。なんとなく、GeForce 20シリーズのままPascal RefreshとAmpereが混在する、という可能性がすごく高そうだが。