2022年の幕開けに、パーソナルコンピュータのハードウェア技術の動向を占う「PCテクノロジートレンド」をお届けする。プロセス編、CPU編に続いて、ここではGPU編を紹介しよう。昨年までのGPU業界は暗号通貨がらみの特需に振り回され、新製品のリリースも滞った感があるが、今年はどうなるだろうか。NVIDIAとAMDにはGPUの世代交代の計画があり、ついにDiscrete GPUに参入するIntelの動きは活発だ。

***

本稿ではGPU編をお届けする。

  • PCテクノロジートレンド 2022 - GPU編

    Photo01: 2005年、知人が公園のゴミ袋にまとめて捨てられているのをたまたま発見。ヘルプ要請を受けて緊急保護した4匹。

NVIDIA GPU(Photo01)

2021年はGPU業界にとって、ある意味空前の景気ではあったが、ある意味最悪の時期であった。言わずと知れた暗号通貨のMining需要であって、中国がMiningの全面禁止を決めた2021年9月までの間、GPUカードはもうとにかく「Miningソフトが動くなら、あるだけ買う」みたいな感じで買い占めが激しく、一般のPCユーザー向けの製品が市場から払底。NVIDIAで言うなら最新のGeForce RTX 3000シリーズどころか、RTX 2000シリーズとかGeForce GTX 1600シリーズまで綺麗に市場から消える有様。で、では中国で禁止になったことで市場が戻るか? と思ったら、そうしたMining業者は設備ごと他国に移動してビジネスを継続しているのだそうで、結果としてMining向けのGPUカード需要は一時期より若干マシとは言えまだそれなりに高く、相変わらず供給不足が続いている。結果、例えばこの原稿を執筆している2012年12月28日現在のGeForce RTX 3080(無印)を日本のAmazonで検索すると、最安値がZOTAC Gaming GeForce RTX 3080 AMP Holo LHRで\171,000ほど。大体20万をやや下回るあたりなら何とか買えるというレベル。GeForce RTX 3080 Tiは20万円超えである。まぁ一番払底した時期は30万近い値段がついて、しかも品切れという状況だったことを考えれば多少はマシなのだろうが。

こういう状況ではNVIDIAも新製品の投入どころの話ではないようで、2021年はGeForce GTX 1050 TiやGeForce RTX 2060が再投入される始末である。もっともGeForce GTX 1050 Tiは例えばこれなどがそうだが、2016年の発表時と同じスペックのままだが、GeForce RTX 2060に関してはGDDR6メモリの容量を倍増させた12GB版(例えばこれ)をラインナップさせて差別化を図っている(というか、昨今のゲームは8GB無いと話にならなくなりつつあるので、これに対応したということか)形だ。

そんなわけで2021年の新製品といえば、GeForce RTX 3000 Tiシリーズしかなかった訳だが、元になるGeForce RTX 3000シリーズは2020年に発表の製品だけに、そろそろ新アーキテクチャの準備は必要である。一応CESのタイミングでGeForce RTX 3090 Tiが発表されるという噂はあるが、現状82SM(GA102そのものは全部で84SM)だから、全SMを有効にして、動作周波数を上げて、ついでにメモリもGDDR6X 20Gとか21Gに変更したとしても、性能向上はそれほど大きくないだろう。勿論GA100コアを持ってくる、という荒業はあるかもしれないのだが、少なくともWhitepaperを読む限りにおいてはGA100にはROP(Raster Operators) Unitが実装されていないので、最終画像のレンダリングをハードウェアで処理できないことになる。実は説明されてないだけで、実装はされている、とすればGA100をベースにした化け物GPUが投入される可能性はあるが。

もう一つの噂は、Superグレードの投入である。GeForce RTX 3060~3080に関して、もうちょっとだけ性能を引き上げたSKUを追加する事でちょっと目新しさを出そうということだろうか? もっともそれをしてもしなくても、品不足のお蔭で「出せば売れる」状況になっている現状では、あまりSuper SKUを積極的に投入する理由に欠ける気もする訳で、筆者としてはちょっと疑わしいと思っている。

それはともかくとして、現在のGeForce RTX 3000シリーズはSamsungの8LPPをベースにした8Nという独自のプロセスであるが、基本Samsungの10LPPとトランジスタ密度などは大きく変わらない。動作周波数、トランジスタ数の両面で限界だからだ(価格を無視すればGA100の様な化け物は作れることになるが、GA100はTSMC N7での製造だから、GeForce向けとは事情が異なる)。ということで現在新しいラインナップを開発中である。

その新ラインナップ、順序としてはGeForce RTX 4000シリーズになる訳だが、コード名はAda Lovelaceだそうで、GeForce RTX 2000シリーズのTuringの名前を汲む感じだ。このところNVIDIAの場合、Tesla(と最近は言わないが、要するにGPGPU系列)とGeForce系列が、同じコアの場合と異なるコアの場合が混在している。ちょっとまとめてみるとこんな感じになる。

GeForce Tesla(GPGPU)
2011 Fermi(GTX 500) 2011 Fermi(C2000/M2000)
2012 Kepler(GTX 600/700) 2012 Kepler(K10~K80)
2015 Maxwell(GTX 900) 2015 Maxwell(M4~M60)
2016 Pascal(GTX 1000) 2016 Pascal(P4~P100)
2019 Turing(RTX 2000) 2018 Volta(V100)
2020 Ampere(RTX 3000) 2020 Ampere(A10~A100)

厳密に言えばTuringコアを使ったT4というGPGPUもあるが、2018~2019年はGeForce向けとTesla向けが別々のアーキテクチャになっており、これが2020年に共通のAmpereに戻った格好だ。で、GPGPUと共通のアーキテクチャの場合は、コード名が物理学者になる一方、GeForce向け専用のTuringはコンピュータサイエンス系の人であって、今回のAda Lovelace伯爵夫人(世界最初のコンピュータプログラマと言われている)の名前を引っ張ってきた辺りは、この世代ではGPGPUとは異なるアーキテクチャになるのかもしれない。ちなみにではGPGPUの方は? というと、Volta、Ampereときたら次はWatt(James Watt)ではないかと思っているのだが、まぁこれは蛇足である。

話をそのAda Lovelaceに戻すと(更に余談だが、となるとコアはGL102とかGL104になるのだろうか? もしくはGA202やGA204なのかもしれないし、AD102やAD104という説もある)、こちらの構成は殆ど判っていない。ただ製造プロセスはProcessの所のTSMCの項で述べたがN5を利用すると見られている。Samsung 8N(≒10LPP)からTSMC N7に移行するだけで50%程度のトランジスタ密度向上が期待でき、N5はそのN7から更に83%アップとされている事を考えると、ざっくり言って倍のトランジスタ数は実装できるだろう。

もっとも、「んじゃGA102が84 SM/10752 CUDA Coreだから、倍の160 SM/20480 CUDA Coreは堅いだろう」とは流石に言いにくい。というのはメモリ帯域が全然足りないためだ。まだGDDR7の議論は始まったばかりで、そもそもモノになるかどうかも怪しい。既にGA102の最大構成(GeForce RTX 3090)でGDDR6X 19.5Gbps/384bit busを実装し、970GB/secとほぼ1TB/secに近いメモリ帯域を利用している。仮にSMの数を倍にすると、2TB/secのメモリ帯域が必要になるわけで、HBM2E(Stackあたり500GB/sec超)を4 Stack実装するか、もしくはHBM3(Stackあたり800GB/sec超)を2 Stack実装するかという話になる。

どちらにしても凄まじい話で、エンスージャスト向けの構成はともかくメインストリームのハイエンドにこれを実装するとは思えない。一つの解はAMDがNavi 21で実装したInfinity Fabricの様な大容量キャッシュを実装する、というアイディアであるがNVIDIAがこれを真似するか? というとやらないような気が非常にする。とはいえ、GDDR6Xは頑張っても転送速度の上限は21Gbps程度で、仮にメモリバス512bit幅まで広げても1.3GB/sec程度に留まる。そう考えると、実はSMの数はそれほど増やさず、むしろRT Core(とTensor Core)の高性能化にトランジスタを費やすことで、Ray Tracing利用時の実効性能を引き上げる方に舵を切るのではないか? と筆者は考えている。一応信頼性の低い数字で言えば、144 SM/18432 CUDA CoreにGDDR6X 21Gbps 384bit Memoryという噂は流れてきているのだが、ちょっとバランスが悪い様に思えるのだが。

このGeForce RTX 4000シリーズ(仮称)、噂では次に説明するNavi 3同様に2022年末~2023年のタイムラインになるのではないかとされていたが、もう少し前倒しが可能になるという話も出ている。要するにAppleがTSMC N4PやN3に移行する事でN5が相対的に空くので、それを獲得できれば前倒しできるという話だ。ただこの枠は当然AMDも狙っている訳で、果たして今年の年末までに製品が出てくるかどうか(いや、アリバイ作り的な少量出荷であれば十分年内に可能だと思うが、本格量産出荷が年内に可能かどうかはまた別の話である)というところかと思う。