AMD GPU

まずコンシューマ向けの話をすると、RDNA 4世代に関してはトップエンドのNAVI 4cの開発に失敗、開発リソースをRDNA 5世代に振り分ける事にしてRDNA 4はRDNA 3 Refreshとなった、という話が2023年後半位から広く流れている。

このRDNA 4は、RDNA 3よりももっとアグレッシブにMCMというかChiplet構造を採用しようとしている。参考になるのはAMDが2022年10月に特許を取得(出願は2021年3月)した"Die Stacking for Modular Parallel Processing"である(Photo03)。Fig.4/5がバリュー~ミドルレンジ、Fig.6/7がハイエンド向けという感じである。これはstacked die chiplet、要するに複数チップの積層構造を想定している。恐らくBase dieはTSMCのN6あたりを使ったCacheとMemory ControllerとCP(Command Processor)を集積するもので、その上にSED(Shader Engine Die)が搭載されている。何のことはない、AMDのInstinct MI300Xと同じ構図である。異なるのは、Fig.4とかFig.6の様に単体での利用も考えて居るあたりだろうか。また、PCIeなどの外部I/FはこのChipletには載っていない。Chipletが複数載ることを考えると、あるいはPCIeなどのI/Fは別のChipletとして一番末端に付くか、もしくはそれぞれのChipletに一応PCIeのコントローラとPHYが載っており、ただし複数Chipletを組み合わせる場合は一つを除いて他を無効化するかのどちらかだろう。

  • Photo03: 特許資料より抜粋。402とか602は、"Graphics processing stacked die chiplet"と表現されている。

このテクニックは、ダイサイズを小さくするというAMDのポリシーに適っているし、CPUでは既に実現できている。ただGPUにそのまま持ち込むのは難しいというのは判っていた話でもある。実際こちらの記事でも触れたが、AMDはRDNA 3世代でもGCDをマルチチップ化する事を検討している。ただSam Naffziger氏(SVP&Corporate Fellow, AMD Product Technology Group)によれば「配線が多すぎて収まりきらない」ということで見送られている。実際Deferred Renderingを多用する場合、複数chipletに分散されたキャッシュに対して全てのShader Engineから再びアクセスが多数発生するわけで、これを最小のLatencyでアクセスできるようにしようとすると配線数が洒落にならない多さになる事が予測される。

このあたりをどう解決しようとしたのかは不明だが、Photo03を見ると504と記された"the bridge chip"(passive chipと書かれているあたり、単なるInterposerだとは思う)を介して複数のchipletをつなぎ合わせる形でGPUを構築しようとしているのが判るから、何か良い方法を見つけたのだろう、とは思う。

思うのだが、どうもうまく行かなかったようだ。このNAVI 4cはCoWoS-Lを使ってこれを実現しようとしたようだ(Photo04)が、そのCoWoS-Lの供給が間に合わなかったという話が伝わってきている(確定ではない)。理由は定かではないが、何にせよRDNA 4ではMCMを利用するプランはご破算になってしまった。

となると、あまり選択肢は残されていない。結局再度策定されたプランは、RDNA 3の構造をそのまま維持しながらプロセス微細化や高速なメモリの採用、それとInfinity Cacheの大容量化で性能を向上させる、という形になったようだ。最終的な構成はまだはっきりしないが、GCDとMCDの組み合わせとなる構図は変わらず、Navi 41相当のハイエンド(コード名は不明)GCDはTSMC N3E、ミドルレンジ向けのNavi 44とバリュー向けのNavi 48はTSMC N4での製造となる。MCDは引き続きTSMC N6ながら、GDDR7への対応やInfinity Cacheの容量増加が図られるらしい(どの程度か? は不明)。ちなみに上に書いたようにGB102は最大512bitのメモリバスを持つと考えられるが、Navi 41相当は引き続き384bit(つまりMCD×6)に抑えられるらしい。MCDそのものの基本的な構成は同じだが、CU数は増加しているものと思われるほか、Ray Tracingユニットの性能強化、それとAI向けの性能向上(FP8のサポート?)などが行われるらしい。このNavi 41相当の製品が、間に合えば今年中にRadeon RX 8000シリーズとして発売され、Navi 44/48は2025年に入ってから、という事になりそうだ。

  • Photo04: CoWoS-Lの構造。従来のCoWoSと異なり、InterposerがSiliconでの製造ではない。この例ではSoCとHBMを接続しているが、Navi 4cではSoC同士をこれで接続しようとしていた模様。

ちなみにCDNAの方だが、実は以前からCDNA 3の次に関するアナウンスが無い。CDNA 4に関する情報も一切流れてこないあたり、ある意味徹底しているわけだが、2020年にCDNAに基づくInstinct MI100、2021年にCDNA 2のInstinct MI200、2023年にCDNA 3のInstinct MI300と来ているので、次は2025年の投入を予定しているのかもしれない。とりあえず今判っている限りでは、Instinct MI400シリーズが2024年に投入される可能性は非常に低そうだ。