AMD CPU(Photo08)

  • Photo08: 里親さんのところに行く数日前のスナップ。里親さんの所では暴れん坊の立派(?)な女王様に進化。

Ryzen 5000シリーズに加え、Ryzen 5000Gシリーズも投入され、ラインナップ的にはかなり充実した2021年。Alder Lakeの投入で最高速プロセッサの座こそ奪われたものの、先日のDeep Diveで確認した限りにおいては、4命令/cycleの処理能力を持つx86プロセッサの中では最も完成したプロセッサ、という感は強い。逆に言えば、もうZen 3ベースのコアをどう弄り回しても、大幅な性能改善は難しいだろう。

そんなZen 3ベースのRyzen 5000シリーズだが、恐らくCESのタイミングで追加製品が発表される。2021年6月のCOMPUTEXにおいて、Su CEOが表明していた3D V-Cache搭載のRyzenである

これでどこまで性能が上がるのか? というのは「アプリケーション次第」という、ややふんわりした表現になるのは致し方ないところ。一つのヒントは、同じくこの3D V-Cacheを搭載したMilan-Xを利用したMicrosoftのベンチマーク結果である。一連の結果はMicrosoftの当該blogをご覧頂いた方が良いかと思うが、例えばAnsys Fluent 2021 R1を利用し、要素数14Mの飛行機の流体解析を行ったケースでは、3D V-Cacheを搭載しないMilanベースのEPYCと比較して平均26%弱、最大で37%もの性能向上が得られたとしている。ただここで注意が必要なのは、このテストは仮想マシン数を1~16まで変化させながらの動作になっており、一番高速だったのは8VMの場合であった。流体解析は要するにメモリアクセスを猛烈に行う訳だが、1~4VMとかだとL3がやや過剰、16VMだと逆に不足するというわけで、最適な組み合わせは8VMだった、というあたりに、要するに性能向上率はどれだけメモリアクセスがあるか次第で決まる、という事が判る。逆にメモリアクセスよりも演算性能そのものが効いてくるNAMD(分子動力学のシミュレーション)の場合、性能向上は最大でも3%でしかない。IPCを引き上げた場合と異なり、アプリケーションによって性能向上率は大きく変わることになる。

Ryzenの場合、COMPUTEXの講演ではGears 5のプレイでFPSが平均15%向上するという実例が示された(Photo09)が、そもそもこれにしても負荷が軽い(Full HDということはあるにしても、180fpsとか200fpsという時点でかなり軽い事が判る)から、相対的にメモリアクセス頻度が高いので性能が向上したものと思われる。なので、もっと重いゲーム(例えばMetro Exodus Extremeを最大描画オプションで4Kとか)で同じだけ性能が上がるか?と言われれば疑問である。アプリケーションとしては、それこそ動画のエンコード/トランスコードとか、デジカメ写真の現像とかであれば性能の向上が期待できそうだが、Office Workloadでどこまで性能が上がるか?というと、3D V-Cacheなしとさして変わらない程度ではないかと思う。この辺りは実際の製品が入手出来たら確認してみたいところだ。

  • Photo09: このシーンでは向上率は11.9%ほど。

もっともこの3D V-Cache付きのVermeer(Vermeer-X?)、恐らくはハイエンドのみに留まると思う。Ryzen 9が搭載候補になると思うが、どんな商品名称になるのかは不明だ。Ryzen 7以下で製品を提供するかは不明だが、可能性はかなり低いと思う。

さて、AMDが2022年に投入するのは勿論3D V-Cache付きZen 3のみではない。Zen 4は2021年中に特定顧客向けに評価機の出荷(ただしEPYC)を始めている。もう実績もあるTSMC N5ベースだからプロセスの問題も発生しにくいし、どれだけの出荷量を確保できるかという話はあるにしても、割と出荷そのものは堅いだろう。ただ現状、Raphael(Zen 4ベースRyzenのコード名)に対応したマザーボードの話が一切無いあたりは、今まさにパートナーが設計/製造を急いでいるというあたりで、あるいはCESで場合によってはPreviewなどもあるかもしれないが、今年5月のCOMPUTEXのタイミングで市場投入という辺りが堅そうだ。

さてそのRaphaelの特徴であるが

  • PackageはSocket AM5(LGA1718)。ただしクーラーはAM4までと機械的互換性があるので、放熱の問題を別にすると既存のAM4用のクーラーがそのまま流用できると見られている。またPGAからLGAに変更された。
  • コアはZen 4ベース。少なくともZen 4cベースの製品に関しては今のところ一切情報が無い(し、製品が出てくるかどうかも怪しい)
  • メモリはLGA1700同様にDDR4/DDR5の両対応
  • PCIe 5.0対応。CXL 1.1対応は不明(ないかも)
  • TDPは45/65/95/105/120/170Wの6種類のSKUが存在する模様

といったところになる。

まずCPUコアのZen 4だが、まだ詳細は明らかになっていない。ただ上で述べた様に、既にZen 3は4命令/cycleのデコードと実行が可能なx86プロセッサとしては一番の完成度を誇っている構成になっており、この構成を維持したままの性能向上は難しいと思われる。なので5命令/cycleのデコーダと、同じく5命令/cycleのALUを搭載してくると思われる。またFPUは見た目には大きく変わらないかもしれないが、2つの256bit SIMDエンジン(どちらもAVX2対応)を組み合わせて、AV512F命令を実行できるようになると目されている。Photo10はZen 3の内部構成だが、これをベースにZen 4の内部構成を推定したのが図2となる。まぁこれはあくまでも筆者の推定であるが、Alder Lakeを見てもFront EndはDecode以外は現在のZen 3のままでもゆとりがあるし、BackendもALUと場合によってはLoad/Store Unitの強化はあるかもしれないが、あまり多くの変更が無くても5命令/cycleの実現は容易そうだ。FPUは(上でも書いたが)今でもAVX2を2命令/cycleで処理できる能力があるし、これを2つ連動させてAVX512を1命令/cycleで処理するのはそう難しくはなく、ブロックの拡充とかLoad/Storeの強化はおそらく不要だろう。強いて言えば多少L1 Cacheが大型化する程度か。この構造をTSMCのN5を使って製造することで、ダイサイズそのものはむしろZen 3世代より小型化すると思われる。

  • Photo10: これは2020年12月のTech Dayで公開された資料。

  • 図2

さてCPU構成としてはMatisseと同じく、CPUコアを格納するCCDとI/Oを担うIODの2つから構成される模様だ。CCDの方だが、同じZen 4を利用するGenoaがこちらのスライドで示すように、CCDが12個でトータル96コアとなるから、CCDあたり8コアで、1つのCCXで8コアというZen 3の構成はそのまま踏襲されると思われる。一方のIODだが、この世代ではついにGPUが入るらしい。ただし

  • 最大4つまでのCCDを接続可能(らしい)
  • GPUが統合される(らしい)

のがZen 3世代と異なる点。

また、製造もGlobalfoundriesの12LPからTSMCのN6に変わる模様だ。まず最大4つのCCDというのは、つまり最大32core/64thread構成がDesktopに入るという話である。先にTDPが170Wというお話を紹介したが、この170Wというのは32core構成の場合の様だ。また、ついにGPUがIODに入ることになった。ただし性能の方は最低限で、一応Navi 2ベースではあるが、CU数は1ないし2程度。つまりWindows Desktopの利用には支障は無いが、ゲームのプレイには不適当な程度とみられる。まぁDesktop向けのRyzen Proには問題ないだろう。ちなみにCUは少ないがMedia Encoderなどはきちんと搭載される模様で、そのあたりは大きなメリットになりそうだ。

PCIeはこちらもGen 5対応になる。現在聞いている話では、単にGPU向けのPCIe x16に加え、SSD用のPCIe x4(CPU側から出る方)もGen 5になるらしい。現状PCIe Gen5対応のSSDは、コンシューマ向けには存在しないが既にServer向けには発表されている。SSDコントローラ自体は2021年5月にMarvellが最初のものを発表しており、コンシューマ向け製品が出てくるのも時間の問題である。IntelのAlder Lake/Raptor Lakeは、GPU向けのPCIe x16こそGen 5だが、SSD用のx4はGen 4のままであり、ここで差別化を図りたいようだ。一方のCXL 1.1、EPYC向けのIODではサポートされるようだが、Ryzen向けのIODは、サポートしてもそのニーズが薄いということでサポートされない模様だ(メカニズムそのものは入っているらしい)。もっともこれ、仮にコンシューマ向けにもCXLベースのAttached Memory/SSDが普及するようであれば、後追いでサポートされるかもしれないが。

ところでそのPCIeとかDDR 4/5 Memory ControllerなどはZen 3までと同じくIODに搭載される模様で、それもあって上でも触れた様にTSMC N6ベースに切り替わる。これそのものは不思議ではないというか、さすがにもうGlobalFoundriesの12LPでは厳しいとは思うので妥当だとは思うのだが、ではこれでAMDとGlobalFoundriesの縁が切れたのか? と思ったら、2021年末になってGlobalFoundriesがAMDとの間でのウェハ供給契約を2025年まで延長した、という話が発表になった。総額21億ドルだから、結構なボリュームのGlobalFoundries製チップが生産されることになる訳だが、一体AMDはGlobalFoundriesで何を作るつもりなのか? この話は下で書きたい。

一方Mobile向け(コード名はPhoenix)だが、こちらは引き続きMonolithicで行くらしい。ベースはZen 4に切り替わるが、Navi2ベースでCU数も多少増強される「らしい」。DDR5のほかにLPDDR5をサポートする(DDR4/LPDDR4のサポートは不明:なくても不思議ではない)。ただPCIeはGen4どまりになりそうだが、ノート向けであればこれは欠点とはならないだろう。

で、実はこのPhoenixの前に投入されると見込まれているのが、Zen 3ベースのRembrandtである。こちらは現状投入されているCezzanneことRyzen 5000Gシリーズの後継というか、Phoenixまでの中継ぎという位置づけのものである。Cezzanneとの違いは

  • 製造プロセスがTSMC N6に。
  • 統合されるGPUがVega 8からNavi 2ベース(10~12CU?)に強化
  • LPDDR5/DDR5に対応(LPDDR4/DDR4も利用可能らしい)

という辺りである。要するにCPU性能的にはTiger Lakeと比較してもそれほど遜色ないので、やや不足気味の統合GPUをNavi2ベースに切り替えて性能の底上げ(と、Tiger Lakeの突き放し)を図ろう、というあたりらしい。このRembrandtは後追いでWarholとしてDesktop向けにも投入されるが、こちらはAM4/DDR4対応であり、最後のAM4向けチップという格好になる。

最後にローエンド向けについて。AMDは現状未だにAシリーズ(SteamrollerコアのCPUにGCNベースのGPUのコンビネーション)を発売しており、その上位モデルとしてAthlon 3000シリーズを用意している。AシリーズはChromebook向け、Athlonはバリュー向けという位置づけであるが、どちらもかなり古い製品で競争力の方がかなり怪しい。といっても最新の製品をこのマーケットに投入するのはコスト的及び生産量に引き合わない。そのあたりもあって、こうしたローエンドをSamsungの6nm(6LPPと思われる)ないし4nm(4LPP?)で製造の製品で賄うという話が出て来た。これはこれで納得行く話であり、例えばZen 2あたりの4コアにVegaを6CU位組み合わせたSoCはかなり小さなダイサイズで実装可能だし、Samsungの6LPPは比較的キャパシティにゆとりがあるから、生産量的に問題は無い。4nmも同様にキャパシティにゆとりがあり、しかも6nmより性能を上げられるマージンがある(=同じ性能なら消費電力を下げられる)から、スマートフォン向けSoCと十分互角に戦える性能/消費電力比を実現できる。

ただ上で書いたGlobalFoundriesとの契約延長でこれがひっくり返った。現状AMDがGlobalfoundriesで製造するものと言ったら、12LPを使う製品しかありえない。とすれば、Picasso APU(つまりRyzen 3000Gシリーズ)しか考えられない。あり得る話としては、既存のAシリーズAPUを、全部Picassoベースの製品(といっても11CUのVega 11は不要と思われる。6~7CUに減らして、その分ダイサイズを減らしても不思議ではない)に置き換えではないかと思われる。位置づけ的に微妙なのが、その上のAthlonグレード。何しろ現状がPicasso APUベースだから、これは何らかのテコ入れが入っても不思議ではない。あるいはChromebook向けのAPUはPicasso APUないしその派生型とし、AthlonグレードをRenoirないしLucienneをベースにSamsungの6LPPに移行させる、という可能性もありそうである。この辺は、未確定情報というか憶測の比率がかなり高いので、情報の確度はかなり低いと考えて頂きたい。