2025年1月30日に発売がスタートする、NVIDIAの最新GPU「GeForce RTX 5090」と「GeForce RTX 5080」。発売に先立って「GeForce RTX 5090 Founders Edition」を試用する機会を得たので、さっそくその実力をチェックしていく。DLSS 4のマルチフレーム生成でフレームレートがどこまで向上するのか注目したい。
GPU名 | RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 |
---|---|---|---|---|
CUDAコア数 | 21,760 | 10,752 | 8,960 | 6,144 |
AI TOPS | 3,352 | 1,801 | 1,406 | 988 |
ベースクロック | 2.41GHz | 2.62GHz | 2.45GHz | 2.51GHz |
ブーストクロック | 2.01GHz | 2.3GHz | 2.3GHz | 2.16GHz |
メモリサイズ | GDDR7 32GB | GDDR7 16GB | GDDR7 16GB | GDDR7 12GB |
メモリバス幅 | 512bit | 256bit | 256bit | 192bit |
RTコア | 第4世代 | 第4世代 | 第4世代 | 第4世代 |
Tensorコア | 第5世代 | 第5世代 | 第5世代 | 第5世代 |
アーキテクチャ | Blackwell | Blackwell | Blackwell | Blackwell |
DLSS | DLSS 4 | DLSS 4 | DLSS 4 | DLSS 4 |
NVENC | 第9世代×3 | 第9世代×2 | 第9世代×2 | 第9世代×1 |
NVDEC | 第6世代×2 | 第6世代×2 | 第6世代×1 | 第6世代×1 |
カード電力 (W) | 575 | 360 | 300 | 250 |
システム電力要件 (W) | 1000 | 850 | 750 | 650 |
価格目安 | 393,800円 | 198,800円 | 148,800円 | 108,800円 |
GeForce RTX 5090は、2025年1月6日にCESで発表された「GeForce RTX 50シリーズ」の最上位モデルだ。価格の目安は39万3,800円からと、前世代の最上位モデルであったGeForce RTX 4090の29万8,000円を超える、圧倒的なエンスージアスト向けのモンスターGPUだ。すでにスペックや機能についてはCESなどのレポートで紹介しているので、ここでは注目ポイントを簡潔に触れておこう。
1つ目は新アーキテクチャ「Blackwell」の採用だ。AI TOPSが前世代のAda Lovelaceアーキテクチャから3倍になり、「Neural Rendering Architecture」と表現されるようにAI性能を大幅に強化しているのが最大の特徴。
これによって、グラフィックの描画は従来のプログラマブルシェーダーからニューラルシェーダーへと移行することになる。非常に簡単にまとめてしまえば、凄まじくクオリティの高いグラフィックを、生成AIを活用することで描画負荷や使用メモリを抑えながら実現しようというもの。各社のGPUにはAI処理用のコアが搭載されるようになっており、今後はこれが主流になっていくだろう。
-
GeForce RTX 50シリーズでは「Blackwell」アーキテクチャを採用。AI性能を大幅に強化しているのが特徴だ
-
2001年から長年使われてきたプログラマブルシェーダーからAIを活用したニューラルシェーダーへと移行する
-
ニューラルシェーダーはDirectXでサポートされることが決まっており、今後開発者が活用しやすくなる
GeForce RTXにおけるニューラルシェーダー(RTX Neural Shaders)は、映画並みの質感を少ないビデオメモリで実現する「RTX Neural Materials」、光の挙動をAIが推測することでパフォーマンスを大幅に向上させる「RTX Neural Radiance Cache」、肌の内部に光が浸透する表現も可能にする「RTX Skin」、ゲーム内キャラクターの表情を豊かにする「RTX Neural Faces」など、その機能は多岐に渡る。
-
映画並みの表現を少ないビデオメモリで実現できる「RTX Neural Materials」
-
光線の反射をAIで予測することでパフォーマンスを向上させる「RTX Neural Radiance Cache」
-
光が肌に浸透するリアルな表現を可能にする「RTX Skin」
-
AIモデルを活用することでキャラクターの表情を豊かにする「RTX Neural Faces」
-
1フレーム当たりのトライアングル描画数を従来の最大100倍にしてよりリアルな表現を可能にする「RTX Mega Geometry」
2つ目は「DLSS 4」の追加だ。最大の注目点は「マルチフレーム生成(Multi Frame Generation)」だろう。DLSS 3ではフレーム生成(Frame Generation)が加わったが、DLSS 4では1フレームに対して最大3フレームの生成を可能にした。これによって、飛躍的なフレームレート向上を実現している。CESではGeForce RTX 5070でRTX 4090と同等の性能と紹介されていたが、これはもちろんDLSS 4があってのことだ。
-
DLSS 4では1フレームに対して最大3フレームの生成を可能にするマルチフレーム生成が加わった
-
DLSS 4ではアップスケーラーとマルチフレーム生成を組み合わせることで、16ピクセル中15ピクセルがAI生成になる
-
DLSS 2で71fpsだったものが、DLSS 4では249fpsまで向上するという
また、学習モデルが従来のDLSSで使用されてきたCNN(Convolution Neural Network)モデルからTransformerモデルへと変更になった。より大規模なデータセットを使ったトレーニングが可能になり、描画の品質が向上、ちらつきも抑えられるようになった。
そして、DLSS 4はRTX 50シリーズの発売と同時に75タイトルも対応するという。それを可能にしているのが、「DLSS Override」だ。これはCNNを学習モデルに使った従来のDLSSを、Transformerの学習モデルに置き換えるというもの。DLSSに非対応のゲームや、アップスケーラーだけのDLSS 2対応ゲームがDLSS 4になるわけではないので注意が必要だ。DLSS 3(アップスケーラー+フレーム生成)に対応するゲームをDLSS 4に変更するもの、という理解が分かりやすいだろう。DLSS OverrideはNVIDIA Appから利用できる。
ちなみに、DLSS Overrideではなく、サイバーパンク2077のようにゲーム内にDLSS 4を直接実装するタイトルもある。DLSS 4のマルチフレーム生成はゲーム内で設定できるタイトルもあれば、NVIDIA Appからの設定が必要なタイトルもありと、バラツキがあるのがちょっとややこしいところだ。それでも最初から対応タイトルが豊富にあるのは素晴らしい。
-
DLSS 4はRTX 50シリーズの発売日から75タイトルで利用できる
-
NVIDIA AppのDLSS Overrideでマルチフレーム生成やTransformerモデルのアップスケーラーを利用できる
-
サイバーパンク2077のようにゲーム内にDLSS 4の設定を実装するタイトルも存在する
-
DLSS 4の恩恵はRTX 40/30/20シリーズでも受けられる。利用できる機能はシリーズによって異なる点は注意が必要だ
このほか、よりマウスやキーボードの入力から画面への反映遅延を軽減する「NVIDIA Reflex 2」への対応、GeForce RTX 5090は第9世代のNVENCを3基も備えており、それを同時に使うことで高速な動画エンコードが可能。メモリにGDDR7を採用することで、GDDR6と比べて2倍のデータレートを半分の電力で実現するなど、前世代から多くの改良が加わっている。
性能テストの前に、GeForce RTX 5090 Founders Editionを紹介しておこう。NVIDIAの純正カードと呼べる存在で、RTX 5090の基本仕様通りの作り。ブーストクロックは2407MHzに設定されている。
4Kかつ高画質&レイトレーシング設定でも高fpsの衝撃
さて、気になる性能チェックに移ろう。テスト環境は以下の通りだ。比較対象としてGeForce RTX 4090を用意した。ドライバに関しては、GeForceはレビュワー向けに配布された「Game Ready 571.86」を使用している。今回は最上位モデルということで、実ゲームのテストは4Kかつ最高画質設定に絞った。
- CPU:AMD Ryzen 7 9800X3D(8コア16スレッド)
- マザーボード:ASUS ROG CROSSHAIR X670E HERO(AMD X670E)
- メモリ:Micron Crucial DDR5 Pro CP2K16G60C36U5B(PC5-48000 DDR5 SDRAM 16GB×2)
- システムSSD:Micon Crucial T700 CT2000T700SSD3JP(PCI Express 5.0 x4、2TB)
- CPUクーラー:Corsair iCUE H150i RGB PRO XT(簡易水冷、36cmクラス)
- 電源:Super Flower LEADEX V G130X 1000W(1,000W、80PLUS Gold)
- OS:Windows 11 Pro(24H2)
まずは、3D性能を測定する定番ベンチマークの「3DMark」から見ていこう。
まず、DirectX 11ベースのFire Strikeで64,025という驚異的なスコアが出た。RTX 4090との比較を見ると、Fire Strike系よりもDirectX 12ベースのSteel Nomadで約53%、レイトレーシングを含むSpeed Wayで約46%もスコアが高い。AIの強化が最大の特徴と言っても、基本性能の高さも凄まじいものがある。
続いて、実際のゲームに移ろう。まずは、DLSS 4に対応していないタイトルから。定番FPS「オーバーウォッチ2」に加え、描画負荷が強烈に高いゲームとして「S.T.A.L.K.E.R. 2: Heart of Chornobyl」、「インディ・ジョーンズ/大いなる円環」を用意した。オーバーウォッチ2はbotマッチを実行した際のフレームレート、S.T.A.L.K.E.R. 2: Heart of Chornobylはザリシアの一定コースを移動した際のフレームレート、インディ・ジョーンズ/大いなる円環はバチカンの一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。
今回はDLSS SRという表はSuper Resolutionの略ですべて「パフォーマンス」設定を採用している。FRはFrame Resolutionの略でDLSS 3のフレーム生成だ。MFGはMulti Frame Resolutionの略でDLSS 4のマルチフレーム生成を指し、1フレームに対して1枚の生成をMFG x2、3枚の生成をMFG x4と表記している。
現役最高クラスの描画負荷を誇る『S.T.A.L.K.E.R. 2: Heart of Chornobyl』や『インディ・ジョーンズ/大いなる円環』の4K、最高画質で高いフレームレートを出している。RTX 4090を20~25%も上回った。特に『インディ・ジョーンズ/大いなる円環』はパストレーシングにも対応するが、平均147.8fpsの滑らかな描画を体験できるのはちょっと感動的。なんせビデオメモリが8GB未満のビデオカードではまともに起動すらできないタイトルなのだ。
続いて、DLSS 4に対応するタイトルを試そう。「マーベル・ライバルズ」、「ホグワーツ・レガシー」、「サイバーパンク2077」を用意した。いずれもレビュー向けのテスト版なので正式版では多少異なる可能性はある。マーベル・ライバルズは訓練場の一定コースを移動した際のフレームレート、ホグワーツ・レガシーは寮内の一定コースを移動した際のフレームレート、サイバーパンク2077はゲーム内のベンチマーク機能を実行した際のフレームレートをそれぞれ「FrameView」で測定している。
フレーム生成によってラグが生じていないか確認するために、PC Latency(入力から表示までの時間)もあわせて測定した。また、サイバーパンク2077については学習モデルをCNNとTransformerの切り替えができたので両方を試している。
マルチフレーム生成の威力は凄まじい。DLSSがオフの状態に比べて約4倍のフレームレートを出している。RTX 4090の1フレームにつき1枚生成の従来型に比べて約2倍のフレームレートを達成している。また、DLSS 4でもフレーム生成時は遅延を減らすNVIDIA Reflexが有効になるのは同様だ。DLSSがオフの状態よりも低遅延を達成しており、マルチフレーム生成が処理に加わっても描画遅延への影響は小さいと言える。
ホグワーツ・レガシーとサイバーパンク2077は、レイトレーシングに対応する描画負荷の高いゲームだ。それでもホグワーツ・レガシーは、マルチフレーム生成を使うことで平均453.3fpsという高いフレームレートを達成。RTX 4090の2倍以上になった。
サイバーパンク2077のレイトレーシング:オーバードライブは、いわゆるフルレイトレーシングなので描画負荷は強烈だ。DLSSオフだとRTX 5090でも平均32.8fpsしか出ていないのがそれを物語っている。しかし、マルチフレーム生成なら平均291.7fpsまで向上。効果の高さがよく分かる。表示遅延に関しては、マーベル・ライバルズと同じ傾向だ。ちなみにサイバーパンク2077は学習モデルを従来のCNNに戻してもフレームレートにあまり変化はなかった。
CGレンダリング性能も大幅向上! 生成AIはFP4対応でより高速に
ここからはクリエイティブ系やAIの処理をテストしていこう。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を試す。
一定時間内にどれほどレンダリングできるのかスコアをして出す仕組み。RTX 4090に対して1.3から1.45倍のスコアを出しており、CGレンダリング性能も着実に向上しているのが分かる。
RTX 50シリーズはAIモデルの演算精度としてFP4(4ビット浮動小数点演算)が新たに加わった。ここでは、高品質な画像生成AIのFLUX.1を使って、1,024×1,024ドットの画像を4枚生成するのにかかる時間を「Procyon FLUX.1 AI Image Generation Demo for NVIDIA」を使ってFP8、FP4の2パターンで測定した。
FP4での画像生成は非常に高速だ。わずか16秒で完了している。RTX 4090はFP4に対応していないので、FP8での生成になるが42.5秒かかった。クリエイティブの世界では作業効率が重要だけに、この差は大きいと言える。
消費電力はカード単体で570W以上、システム全体で820Wに達することも
次はRTX 5090カード単体とシステム全体の消費電力をチェックする。カード単体はビデオカードの消費電力を実測できるNVIDIAの専用キット「PCAT」を使用した。システム全体はOS起動10分後をアイドル時とし、サイバーパンク2077実行時、Blender実行時の最大値を計測している。電力計にはラトックシステムの「REX-BTWATTCH1」を使用した。
RTX 5090のカード電力は575Wだが、サイバーパンク2077はDLSSオフにするとほぼその最大値に到達した。DLSSやフレーム生成を有効にすると描画負荷が軽減されるので、それに合わせて消費電力も少し下がっているが、それでもRTX 4090を大きく上回った。BlemderもGPUをフルに使うので570.4Wと上限に近くなっている。
システム全体の消費電力を見ると、RTX 5090はCPUとGPUの両方が高負荷になるサイバーパンク2077で820Wに達している。RTX 5090の推奨電源が1,000W以上になっているのが分かる結果だ。
最後に温度とクロックの推移をチェックしよう。サイバーパンク2077を10分間プレイした際の温度と動作クロックの推移を「HWiNFO Pro」で測定している。GPU温度は「GPU Temperature」、クロックは「GPU Clock」の値だ。バラック状態で動作させている。
ブーストクロックは2,700MHz前後で動作。仕様上のブーストクロック2,407MHzなので、ゲーム中はそれよりも高いクロックで動作していた。GeForce RTX 5090 Founders Editionは2スロット厚とスリムな作りなので冷却力が心配されるところだが、最大で86℃。ちょっと高めではあるが、許容される最大温度の90℃には到達していないので問題はないだろう。
と、ここまでがGeForce RTX 5090 Founders Editionのテスト結果だ。DLSS 4によるマルチフレーム生成の威力は確かで、4Kの最高画質、フルレイトレーシングのゲームでも余裕で快適に遊べるだけのフレームレートを出せる。DLSS OverrideによってDLSS 3タイトルの多くがDLSS 4に対応できるのもよいところ。ニューラルシェーダーも優秀で活用したゲームの登場が楽しみ。AI時代を象徴するGPUが登場したと言ってもよいだろう。RTX 5090は価格が高いので、ゲーミング用として現実的になるRTX 5080以下を早く試してみたいところだ。