NVIDIAがAmpereアーキテクチャベースの新世代GeForce GPUとして発表したGeForce RTX 30シリーズ。そのうち最初に市場投入されるのが「GeForce RTX 3080」である。先にPreviewをお届けしたが、発売日を明日に控えて、このGeForce RTX 3080の性能レビューが解禁となったので、ご紹介したいと思う。

  • 【レビュー】GeForce RTX 3080の性能を徹底検証する

    今回入手したGeForce RTX 3080のFounders Edition

ボード構成、GA102 GPUのサイズは?

先のPreviewの時は分解不可(まぁOKが出ても、この複雑なカードの分解はちょっと怖いが)ということでお見せ出来なかったボードの写真だが、幸いNVIDIAから提供されているので、まずはこれから見て行きたい。ボードそのものは極めて短く切り詰められた構成になっており、後端はファンにあわせて斜めに切り取られている(Photo01)。余談だが、このボードの構成はNVIDIA A100の発表の際に併せて発表された、MellanoxのConnectX-6DXまでのせたEGA A100(Photo02)を彷彿するものがある。ところでPhoto01に戻ると、本来12個搭載できるGDDR6Xのパターンがあり、うち10個が実装されているという事から、GeForce RTX 3090も同じ基板を用いて提供されるものと想像される。それでいて一回り大きいというのはどういうことか? というのはGeForce RTX 3090を試す機会を待つことになるだろう。

  • Photo01: よくこのスペースにVRMを詰め込んだものだという気もする。

  • Photo02: これは推論向けで、ネットワークから直接データを取り込んで、処理した結果を再びネットワークに送り出す(PCI Expressは制御用)用途向けのカード。

ヒートシンクの構造はこんな格好(Photo03)。Previewでご紹介した写真にでている4本のヒートシンクの構造が良くわかる。

  • Photo03: 後端にスナップがあるあたり、このスナップを外すとヒートシンクが分離できる構造とみた(実際には開けてないのであくまで推定だが)。

真上から基板を見たのがこちら(Photo04)。GA102チップとGDDR6X、それとVRMとコントローラの塊といった感じになっている。同様にヒートシンクも(Photo05)。ところでPhoto04から中心部を切り抜いたのがこちら(Photo06)。GDDR6Xの寸法が14mm×12mmと判っているので、ここから

GA102パッケージ:51mm×51mm
GA102ダイサイズ:23.6mm×27.2mmで641.9平方mm

と推定される。公開されているダイサイズはもう少し小さい様だが(628平方mmらしい)。

  • Photo04: VRMは18way。それはいいのだが、コントローラも18個というのが壮絶である。マザーボード用とかだと1つで6ch位まで制御できるVRMコントローラが存在するが、そうした専用品がなく、汎用品を流用したためだろうか?

  • Photo05: 左半分の細かいフィンはヒートパイプにきちんと接続されている模様。意匠と性能を両立させるためだろうが、コストが掛かっていそうな作りだ。

  • Photo06: TU102(Titan RTXとGeForce RTX 2080 Tiに採用)が754平方mmだからそれよりは小さいとはいえ、GeForce RTX 2080のTU104(545平方mm)を軽々とオーバーしている巨大ダイ。

GPU-Zでは問題なく認識された(Photo07)。それはいいのだが、ちょっとBIOSを覗いてみると、Power Limitが最大で370Wという表示が(Photo08)。これを見る限り、かなりの発熱を覚悟しなければならないことが予想される。

  • Photo07: ちなみにGPU-Z 2.33.0だと何も言わずに起動後即クラッシュしており、これへの対策版が2.34.0と思われる。

  • Photo08: GeForce RTX 3080でこれなのだから、GeForce RTX 3090だとどうなってしまうのだろう。

ベンチマークテストの環境

では実際にベンチマーク結果をご紹介したい。今回は比較対象としてGeForce RTX 2080 Superと2080 Ti、それと一応AMDのRadeon RX 5700 XTも用意してみた。テスト環境は表1の通りである。

■表1
CPU Ryzen 9 3900X
Motherboard ASUS TUF Gaming X570-PLUS
BIOS Version 2607
Memory CFD W4U3200CM-16G×2 (DDR4-3200 CL22)
Video GeForce RTX 2080 Super Founder Edition
GeForce RTX 2080 Ti Founder Edition
GeForce Driver 452.06 DCH WHQL
GeForce RTX 3080 Founder Edition
GeForce Driver 456.16 DCH
Radeon RX 5700 XT Reference
Radeon Software 20.8.2
Storage Intel SSD 660p 512GB(M.2/PCIe 3.0 x4) (Boot)
WD WD20EARS 2TB(SATA 3.0)(Data)
OS Windows 10 Pro 日本語版 Version 2004 Build 19041.450

なお、以降のグラフでは

2080 Super:GeForce RTX 2080 Super Founder Edition
2080 Ti :GeForce RTX 2080 Ti Founder Edition
3080 :GeForce RTX 3080 Founder Edition
5700XT :Radeon RX 5700XT Reference

となる。また一部のテストではRT(Ray Tracing)On/Offの両方が混在している。ここでRTを有効にしたものは

2080 Super(RT):GeForce RTX 2080 Super Founder Edition RTX On
2080 Ti(RT) :GeForce RTX 2080 Ti Founder Edition RTX On
3080(RT) :GeForce RTX 3080 Founder Edition RTX On

となっている。また解像度表記は

2K :1920×1080pixel
2.5K:2560×1440pixel
3K :3200×1800pixel
4K :3840×2160pixel

とさせていただく。

◆3DMark v2.12.6949(グラフ1~10)

3DMark v2.12.6949
UL Benchmarks
https://benchmarks.ul.com/3dmark

9月3日に、GeForce RTX 3000シリーズへの対応やアップデートがアナウンスされた3DMarkであるが、今回はまだ対応版は間に合っておらず、Version 2.12.6949のままである。

  • グラフ1

まずグラフ1がOverallである。Port Royalに関してはRadeon RX 5700XTは未対応なので、GeForce RTXの3製品のみである。もう結果は見ての通りで、GeForce RTX 2080 SuperとGeForce RTX 2080 Ti、GeForce RTX 3080がほぼ一定のスコア差で並ぶという結果になっている。さすがにNightRaidに関してはCPUの方がボトルネックになっている感じで殆どスコア差が無いが、あとはきっちりと性能差がでている。

  • グラフ2

  • グラフ3

  • グラフ4

これはGraphics Test(グラフ2)でも顕著であり、実際一番負荷が高そうなTimeSpy Extremeにおいても、GeForce RTX 2080 Superが30fps台、GeForce RTX 2080 Tiでも40fps前後なのが、GeForce RTX 3080ではきっちり50fps以上をマークしている。グラフ3は確認の意味であるが、Physics/CPU Testの結果はどれも殆ど差が無く、CPU負荷が特に増えているといった事もない。それもあってCombined Test(グラフ4)では、SkyDiver/FireStrikeあたりでは(CPUの方がネックになって)大差ないが、GPUがネックになりやすいFireStrike Extreme/Ultraでは再びGeForce RTX 3080が最高速になっており、実に判りやすい。

  • グラフ5

グラフ5はDLSS Testで、ここは将来のバージョンではテスト内容が変わると思われるが、今はとりあえずDLSS On/OffでPort Royalの画面描画性能がどう変わるかの確認である。性能向上比は3製品ともほぼ同じく、DLSS Onにすることで40%ほどの改善がみられるが、DLSS Offにおける地の性能がやはりGeForce RTX 3080が圧倒的に高いのがそのまま結果に繋がっている格好だ。

  • グラフ6

グラフ6はPCI Express Testである。こちらのテストの場合、Bandwidthがそのままフレームレートに直結するタイプのものであり、ここではRadeon RX 5700XTもPCIe Gen4対応ということで健闘しており、ほぼGeForce RTX 3080並み。一方GeForce RTX 2080 Super/TiはPCIe Gen3対応ということで帯域がほぼ半減という、まぁセオリー通りの結果になっている。

◆Basemark GPU 1.2(グラフ7~9)

Basemark GPU 1.2
Basemark
https://www.basemark.com/products/basemark-gpu/

  • グラフ7

  • グラフ8

  • グラフ9

もう少しSynthesis Benchmarkを、ということで次はBasemark GPUを。今回はちょっと負荷を上げるためCustom Testを利用し

  • 解像度:4K・フルスクリーン
  • Contents Quality:HIGH
  • Texture Compression:bc7

としたうえで、DirectX12(グラフ7)/OpenGL(グラフ8)/Vulkan(グラフ9)で測定を行い、その結果をまとめたものだ。とりあえず平均フレームレートで比較した場合、GeForce RTX 2080 Superを1とすると

2080Ti 3080 5700XT
DX12 1.20 1.54 0.76
OpenGL 1.20 1.29 0.46
Vulkan 1.23 1.59 0.73

となる。OpenGLはあまり力を入れてない(ここに注力するのはQuadro系のプロフェッショナルビデオカード用ドライバだけである)ためもあってか性能の伸びがいまいちだが、DirectX12/Vulkanでは50%以上のフレームレート向上が確認できた。

◆SuperPosition v1.1(グラフ10~16)

SuperPosition v1.1
Unigine
https://benchmark.unigine.com/superposition

もう一つSynthesisを、ということでこちら。今回は

  • Shaders Quality:High
  • Texture Quality:High
  • Depth of Field:On
  • Motion Blue:On

という環境で解像度を変化させながら測定すると同時に、OCAT V1.6を使ってフレームレート変動も取得してみた。

  • グラフ10

  • グラフ11

  • グラフ12

  • グラフ13

  • グラフ14

  • グラフ15

  • グラフ16

まずグラフ10~12がそれぞれ平均/最大/最小フレームレートとなる。もう見ての通りで明確に性能差があり、GeForce RTX 3080の性能の高さが伺えるが、ちょっと面白かったのがフレームレート変動。2K(グラフ13)で75~110秒あたり、GeForce RTX 3080とGeForce RTX 2080 Tiのグラフがきっちり重なっているのは、多分ここがCPUのボトルネックになっているものと思われる。逆に言えば、ここで更に性能が上がれば(例えばZen 3とか?)、もう少し2Kにおける平均フレームレートが引きあがると思われる。2K~4Kまで通して、GeForce RTX 3080のフレームレートは、概ねGeForce RTX 2080 Superの5割増しといったところである。4Kの結果(グラフ16)で見ると、ちょっとだけQualityを下げれば十分4Kでの利用が可能な性能、と言えるだろう。