米国時間の3月16日、AMDはOEMに対してRyzen Mobile 4000シリーズの出荷を開始した。これはあくまでもOEMに向けて、という話であってOEMメーカーから製品が投入されるのはもう少し先の話であるし、なにせ今回出荷開始されたのはBGAパッケージのみだから、店頭に並ぶ事はまず無い。筆者を含めてSocket AM4のPGAパッケージ版を待つユーザーは少なくないと思うが、もう少々我慢して待つしかない。

さてそのRyzen Mobile 4000シリーズ(以下面倒なのでコード名のRenoirとする)であるが、詳細に関して2月に説明が行われたので、この内容をお届けしたい。

Architecture

Renoirそのものは今年のCESで発表されたが、ラフに言えばZen 2(8コア)+Vega(8コア)という構成を、7nmプロセスでモノリシックダイで提供するというものである。まずCPUの方であるが、マイクロアーキテクチャそのものはZen 2そのままで特に変更はない(Photo01)。ただCCXに関して言えば、Ryzen 3000シリーズがCCXあたり16MB、1ダイ(=2CCX)あたり32MBだったのに対し、RenoirではCCXあたり4MB、ダイ全体で8MBになっている。

  • AMD Ryzen Mobile 4000シリーズの詳細を明らかに

    Photo01: 内部のBufferのサイズとかを含めて、このレベルでの変更は一切なく、Zen2そのものとの事。

  • Photo02: "2X L3 Cache"はRaven Ridge/Picasso世代との比較(こちらもCCXあたり4MBだが、そもそも1CCXなのでトータルでも4MBでしかない)。

一方のGPUである。基本は7nm Vegaの構成そのままだが、Raven Ridge/Picassoが11CU構成なのに対し、Renoirは8CU構成である。ところが実際にはPhoto03にあるように、Data Fabricの広帯域化や動作周波数の向上、更にLPDDR4X-4266サポートによるメモリ帯域の増加(Raven Ridge/Picassoは公式にはDDR4-2400のサポート)などもあり、理論性能そのものは若干下がっているものの、実効性能はむしろ向上した、としている。このあたりは後程ベンチマーク結果を交えてご紹介したい。

ちなみにそのVega GPUにおける省電力の効果がこちら(Photo04)。1CUあたりの性能が最大59%向上したとしている。その内訳は、主に7nmプロセスを利用することで性能/消費電力比を改善したことだそうだ。

  • Photo04: これがFireStrikeになると、CUの性能よりもメモリ帯域の方が効いてきそうだが、TimeSpyなのでCU性能が支配的、と言う事らしい。

そのVega GPUに付属するMedia Encoderであるが、ラフに行って3割ほどの性能改善が図られたそうだ(Photo05)。これはNAVIに搭載されたもののサブセット、という感じではあるが、Raven Ridge/Picassoに搭載された初代VCN(Video Core Next)からは高速化されている、という話である。

  • Photo05: NAVIの場合、H.264が4K150fpsデコード/4K90fpsエンコード、H.265が4K60fps デコード/4K90fps エンコードとなっており、eスポーツ向けにややエンコード性能が高めである。ただRenoirではそこまでの性能が出ないから、このあたりでバランスを取ったのだろう。

CPUコアも、勿論Zen世代に比べれば省電力化が進んでいるが、こちらはデスクトップと変わらないので割愛するとして、Infinity Fabricに関してがこちら(Photo06)。外部へのI/F(つまりI/O Chipletとの接続)を考慮する必要が無い分、ドライバをより省電力で実装可能となり、更にバス幅を増やすことで速度を落としても帯域が確保できる様になった事で、ますます省電力化が可能になったという形だ。ここはデスクトップ向けと全く異なる実装であり、それもあってデスクトップ/サーバー向けの既存のZen 2のCPU Chipletの再利用をしなかった(というか、出来なかった)ものと考えられる。

  • Photo06: デスクトップと異なり、ダイ内の接続のみなので、より効率的な転送が可能になっているとする。

SoC全体としても、従来比で20%の消費電力が削減でき、またCPU Offに入るまでの時間を1/5にしたとしている(Photo07)。

  • Photo07: 主にI/OというかChipset Function周りで大幅な消費電力削減が可能になった、として用かと思う。

また、ハードウェアというよりもファームウェア側の対策という気もするが、ACPI 6.3に準じる形でC Stateの深さを選択できる様になった(Photo08)。ACPI 6.3ではこれはLPI(Low Power Idle)Stateとして追加されたものだが、要するにOSがアプリケーションの負荷状況を見て、CC1据え置きにするか、CC6までで止めておくか、Vdd Ooffまで行くかを選択できる様にできるというものだ。従来はIdleになると一定時間後にCC6、ついでCPU offを経てVdd Offになる訳だが、CC6からCC1への復帰にはちょっと時間が掛かるし、Vdd Offまで行くと猛烈に時間が掛かる。なので中途半端に省電力モードに入ってしまうと、そこからの復帰に手間取ることになる。そこでOS側で、どのレベルの省電力モードに入るかを調整できるというのがRenoirの特徴で、これにより待機時間を最小にできる、とする。

  • Photo08: ちなみにLPI Stateは複数設けられる(3つとは限らない)が、ACPI 6.3のSpecificationにおけるサンプル(Table 8-271)が3段階になっており、これに合わせてある感じだ。

気になるChipset Functionの方だが、こんな感じ(Photo09)になっている。Picasso世代との大きな違いは、同じパッケージサイズながら

  • メモリ帯域の高速化
  • PCIeを4レーン増やした
  • USBポートを2つ増やした

というあたりである(Photo10)。ここでLPDDR4Xについては、仮想的に内部で一つのメモリコントローラを2chに分割する形で、x32構成をサポート出来るとする(Photo11)。またUSBではMST(Multi Stream Transport)をサポートしており、このため2つのモニターを同時にサポートできるとする(Photo12)。このDisplay周りでちょっと興味深いのは、AIDA(AMD Integrated Device Translation)と呼ばれる機構であるが、要するにRenoirではGPUとGPUが同じメモリ領域をフレームバッファとしてアクセス可能なので、バッファメモリを二重持ちする必要がなく、これによりよりメインメモリを広く使える、という事の様だ(Photo13)。

  • Photo09: Desktop向けの場合は、外部にChipsetが付くことになるから、これはあくまでMobile向けであって、この程度の機能があれば十分ということだろう。

  • Photo10: メモリはもう先に説明した通り、LPDDR4Xのサポートが追加されている。

  • Photo11: 正直これはちょっと意外だった。LPDDR4Xの場合、例えばSamsungのラインナップだとx64構成もあるからだ。このあたりは設計の自由度(というか、x32構成の方が安価)な事を重視したのか、それとも容量(現時点では64Gbitチップが最大容量なので、x64構成だと2個=16GBが最大容量になる。x32なら4個=32GBまで利用可能)を重視したのか。

  • Photo12: 10Gbpsというから、恐らくはSuperSpeed USB 10Gbps(USB 3.2 Gen2)の話であって、SuperSpeed USB 20Gbps(USB 3.2 Gen2x2)はまだと思われる。

  • Photo13: 単にGPUとCPUがメモリを共有しているだけだと、メモリにパーティションを設け、GPUの利用するエリアはCPUから利用不可になるだけで、この結果フレームバッファへの書き込みはメモリ→メモリの転送が発生することになるし、利用メモリ量も増える。

最後にダイ全体の写真(Photo14)を。ダイサイズは筆者は140平方mm台と推定していたが、もうちょっと大きく156平方mmとなっている。Matisse(つまりZen 2ベースのRyzen 3000シリーズ)のCPU Chipletのサイズが74平方mmだから、これ2つ分よりも大きい。Matisseの場合はI/O Chipletの125平方mmの分を加味する必要があるが、N7プロセスの生産コストが12LPプロセスの概ね倍と考えると、Matisseは7nm換算で137平方mmになる訳で、つまりCPU Chipletが一つのMatisseよりもRenoirの方がややチップの原価は高いという事になる。これはちょっと意外であった。そのダイ写真のアップがこちら(Photo15)。GPUエリアの面積の小ささがちょっと特徴的である。

  • Photo14: とは言えパッケージコストは複雑なMCMを利用しないで済む分Renoirの方が安価と思われ、トータルするとMatisseと同程度、というあたりかもしれない。

  • Photo15: あとでDavid McAfee氏(Senior Director of Client Product Management)に「よくGPUがこのサイズで収まりましたね」尋ねた所、「頑張った」という返事が。ちなみに氏は「やっとIntelと戦える、競争力のある製品が出来た」と大変に嬉しそうだった。