2024年1月9日、CES 2024で発表されたNVIDIAの最新GPU「GeForce RTX 40 SUPER」シリーズ。1月23日の23時にその中の1つ、「GeForce RTX 4070 Ti SUPER」のパフォーマンス情報が解禁となった。
今回は、Palit製の「GeForce RTX 4070 Ti SUPER JetStream OC」を試用する機会を得たので、さっそくレビューをお届けしたい。RTX 4080 / 4070 Ti / 4070 SUPER / RTX 4070と比較し、ゲーム時のパフォーマンスや消費電力、AI性能の違いをチェックしていく。
「GeForce RTX 40 SUPER」シリーズは、RTX 4080 SUPER / RTX 4070 Ti SUPER / RTX 4070 SUPERが発表されている。1月17日にはRTX 4070 SUPERの発売が開始。今回レビューするRTX 4070 Ti SUPERは1月24日に発売がスタートする。そしてRTX 4080 SUPERは1月31日発売を予定しており、3週連続のリリースとなる。
RTX 4070 Ti SUPERは、既に展開されているRTX 4070 Tiの強化版という位置付けだ。カード電力が285WとRTX 4070 Tiから据え置きながら、CUDAコア数は7,680基から8,448基に、ビデオメモリの容量はGDDR6Xが12GBから16GBにそれぞれ増加している点が大きなトピック。メモリバス幅も192bitから256bitになっており、スペック上は上位のRTX 4080にかなり近づいたと言える。そのほか、主な仕様は下の表にまとめた。
GPU名 | RTX 4080 | RTX 4070 Ti Super | RTX 4070 Ti |
---|---|---|---|
CUDAコア数 | 9,728 | 8,448 | 7,680 |
ベースクロック | 2210MHz | 2340MHz | 2310MHz |
ブーストクロック | 2510MHz | 2610MHz | 2610MHz |
メモリサイズ | GDDR6X 16GB | GDDR6X 16GB | GDDR6X 12GB |
メモリバス幅 | 256bit | 256bit | 192bit |
RTコア | 第3世代 | 第3世代 | 第3世代 |
Tensorコア | 第4世代 | 第4世代 | 第4世代 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace |
DLSS | 3 | 3 | 3 |
NVENC | 第8世代×2 | 第8世代×2 | 第8世代×2 |
カード電力 (W) | 320 | 285 | 285 |
システム電力要件 (W) | 750 | 700 | 700 |
電源コネクタ | 8ピン×3または450W以上の12VHPWR×1 | 8ピン×2または300W以上の12VHPWR×1 | 8ピン×2または300W以上の12VHPWR×1 |
なお、ワットパフォーマンスに影響しやすい2次キャッシュ容量は48MBとRTX 4070 Tiと同じ。RTX 4080は64MB搭載しているので、この点は異なる。NVENCに関してはRTX 4070 TiやRTX 4080と同様に第8世代のものを2基搭載しており、同時使用してのデュアルエンコードが可能。もちろん、ほかのRTX 40シリーズと同様にAV1のハードウェアエンコードにも対応しており、動画編集や配信用としても有用だ。
RTX 4070 Ti SUPERの価格については、NVIDIAの参考価格は127,380円から。RTX 4070 SUPERは初出時86,800円からと発表されていたが、これは発売後に税別価格だったことが判明。そのため、実際には税込み95,480円からとなっている。そしてRTX 4070 Ti SUPERにおける大半の製品は、RTX 4070 TiとRTX 4080の間の価格となる15万円前後に設定されるのではと筆者は見ている。
そのほか、Ada Lovelaceアーキテクチャの採用など基本的な特徴はこれまでのRTX 40シリーズと同じだ。特徴についてはRTX 4090のレビュー『「GeForce RTX 4090」の恐るべき性能をテストする - 4K+レイトレで高fpsも余裕のモンスターGPU』で確認してほしい。
性能テスト前に、評価機材のGeForce RTX 4070 Ti SUPER JetStream OCを紹介しておこう。カード電力は285Wと定格だが、ブーストクロックは2,610MHzから2,640MHzに向上させたファクトリーOCモデルとなっている。カード長は328.9mmで、3.1スロット厚というかなりの大型カードだ。導入を考えるなら、PCケース側が対応しているか確認しておいたほうがよいだろう。
RTX 4070 Tiより10%以上のスコア上昇が見られる確かな性能向上
さて、性能チェックに移ろう。テスト環境は以下の通りだ。Resizable BARは有効にした状態でテストしている。比較対象としてGeForce RTX 4080、GeForce RTX 4070 Ti、GeForce RTX 4070 SUPER、GeForce RTX 4070。CPUのパワーリミットは無制限に設定。ドライバに関しては、RTX 4080/RTX 4070 Ti SUPERが「Game Ready 551.15」、RTX 4070 SUPERが「Game Ready 546.52」、それ以外は「Game Ready 546.33」を使用している。
- CPU:Intel Core i9-13900K(24コア32スレッド)
- マザーボード:MSI MPG Z790 CARBON WIFI(Intel Z690)
- メモリ:Micron Crucial DDR5 Pro CP2K16G56C46U5(PC5-44800 DDR5 SDRAM 16GB×2)
- システムSSD:Western Digital WD_BLACK SN850 NVMe WDS200T1X0E-00AFY0(PCI Express 4.0 x4、2TB)
- CPUクーラー:Corsair iCUE H150i RGB PRO XT(簡易水冷、36cmクラス)
- 電源:Super Flower LEADEX V G130X 1000W(1,000W、80PLUS Gold)
- OS:Windows 11 Pro(22H2)
今回はビデオカードの消費電力を実測できるNVIDIAの専用キット「PCAT」を使用し、ゲーム系のベンチマークではカード単体の消費電力も合わせて掲載する。
まずは、3D性能を測定する定番ベンチマークの「3DMark」から見ていこう。
RTX 4070 Tiから4~10%程度の性能向上が確認できた。一方で、RTX 4080のほうがさらに15~20%上回っており、3DMarkを見る限りではRTX 4070 Ti寄りの性能と言える。
次は、実際のゲームを試そう。まずは、軽めのFPSとして「レインボーシックス シージ」と「Apex Legends」を実行する。アップスケーラーは使用せず“素”の性能をチェックしてみたい。レインボーシックス シージはゲーム内のベンチマーク機能を実行、Apex Legendsはトレーニングモードの一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。
レインボーシックス シージのフルHDは、GPUに負荷がかかりきらないので参考程度に見て欲しい。RTX 4070 Tiに対してWQHDで約8%、4Kで約10%のフレームレート向上を確認できた。消費電力を見ると、4Kで277.2Wとカード電力の285Wに迫っている。GPUの性能を十分引き出せている証拠と言えるが、カード電力にもう少し余裕があれば、さらにフレームレートが伸びたのではと思わせる部分でもある。
Apex Legendsはフレームレート制限を解除するコマンドを使っても最大300fpsまでしか出ない。そのため、フルHDだとRTX 4070以外はほぼ上限に到達。RTX 4070 Ti SUPERとRTX 4080はWQHDでもほぼ上限に達している。このゲームに関しては、RTX 4070でも4Kで平均160.5fpsと高いフレームレートが出ており、これ以上のGPUはオーバースペックといってもよいだろう。
続いて、アップスケーラーのないタイトルとして「ストリートファイター6」と「ARMORED CORE VI FIRES OF RUBICON」を試したい。ストリートファイター6はCPU同士の対戦を実行した際のフレームレート、ARMORED CORE VI FIRES OF RUBICONはミッション「武装採掘艦破壊」で一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。
ストリートファイター6は120fpsまで設定できるが対戦時は60fpsまでになる。今回使用したGPUならば、最高画質設定でも4Kまで快適にプレイが可能だ。最大フレームレートが低ければ、消費電力もそれに合わせてかなり下がるのがポイントと言える。
ARMORED CORE VI FIRES OF RUBICONは、最大120fpsだ。RTX 4070 Ti / RTX 4070 Ti SUPER/RTX 4080はWQHDまでほぼ上限に到達。4Kで見るとRTX 4070 Ti SUPERは、RTX 4070 Tiより約12%フレームレートが上回っている。高負荷な状況ほど性能差が出やすい傾向だ。ただ、カード電力は同じでも、4K時はRTX 4070 Ti SUPERのほうが消費電力は大きくなりやすい。
DLSS 3対応ゲームでテスト! フルレイトレーシングを4Kで楽しめる
次は、DLSS 3(アップスケール&フレーム生成)に対応したゲームでフレームレートを測定していく。DLSS 3はRTX 40シリーズだけで利用できる描画負荷軽減技術だけに、重量級ゲームがどこまで快適にプレイできるのか注目したい。
まずは、人気レースゲームの「Forza Horizon 5」を実行する。どちらも画質はプリセットの最上位を設定し、DLSSはパフォーマンスとし、フレーム生成を有効化している。ゲーム内蔵のベンチマーク機能を実行した際のフレームレートを「FrameView」で測定している。
RTX 4070 Tiから約2~5%のフレームレート向上を確認できる。4Kで平均146.9fpsと4K/144Hzのゲーミングモニターの性能を活かしきれるフレームレートが出ている点に注目したい。消費電力を見ると、RTX 4070 Tiに対して、向上したフレームレートの分だけキッチリ大きくなっている印象だ。
次は、重量級タイトルとして「Starfield」と「サイバーパンク2077」を試そう。同じく画質のプリセットは最上位にし、DLSSはパフォーマンス、フレーム生成を有効化した。サイバーパンク2077については、レイトレーシングの画質を向上させるDLSS 3.5の機能「Ray Reconstruction」も有効化した。Starfieldはジェミソンのロッジ周辺の一定コースを移動した際のフレームレート、サイバーパンク2077はゲーム内のベンチマーク機能を実行した際のフレームレートをそれぞれ「FrameView」で測定している。
Starfieldは165fps近辺で頭打ちになるようだ。描画負荷が重いと言われてきたゲームだが、DLSS 3に対応したことでRTX 40シリーズではかなり快適にプレイが可能となった。4Kでもかなり高いフレームレートが出ている。RTX 4070 Ti SUPERはRTX 4070 Tiに対して、4Kでは約6%フレームレートが上回った。
サイバーパンク2077は、すべての光をシミュレートする“フルレイトレーシング”とも呼ばれる「レイトレーシング:オーバードライブ」に設定している。これが生み出す光源処理は非常に美しく、一見の価値ありだ。RTX 4070 Ti SUPERなら、4Kでも平均71.9fpsと快適にプレイが可能だ。
CGレンダリングやStable Diffusionでも性能比較
ここからはCGレンダリングやAI処理を試していく。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を実行する。
一定時間内にどれほどレンダリングできるのかをスコアとして出すベンチマークだ。RTX 4070 Tiに対して約10~15%スコアを伸ばしており、確かな性能向上を確認できた。ただ、RTX 4080のほうがさらに約17~20%スコアが上回っており、上位モデルとの差を感じる部分でもある。
次は「Procyon AI Inference Benchmark for Windows」を実行する。MobileNet V3、Inception V4、YOLO V3、DeepLab V3、Real-ESRGAN、ResNet 50と複数の推論エンジンを使ってAIの総合的なパフォーマンスを測定するベンチマークだ。Windows MLとNVIDIA TensorRTでテストした。
RTX 4070 Tiとは誤差レベルのスコア差となった。AI処理といっても、CUDAコアやビデオメモリの増加が必ず効くわけではないようだ。
続いて、画像生成AIとしてStable Diffusionを実行してみたい。AUTOMATIC 1111版Stable Diffusion web UIにTensorRT拡張を導入し、Stable Diffusion XLで1,024×1,024ドット、Stable Diffusion 1.5で512×512ドットの画像サイズで1分間に何枚の画像を生成できるかテストを行った。Sampling Methodは「Euler a」、Sampling Stepsは「50」、CFG Scaleは「7」、Batch Sizeは「1」、Batch Countは「10」に設定、シード値も固定している。
性能差が順当に出たと言ってよいだろう。ビデオメモリが16GBのRTX 4070 TiとRTX 4080が劇的に高速になる、というわけでもなく、RTX 4070 Ti / RTX 4070 SUPER / RTX 4070も12GB搭載しており、TensorRT拡張で画像生成するなら12GB以上あれば問題なく動作すると言ってよいだろう。機会があれば、ビデオメモリ8GBのモデルも含めて試してみたい。
NVENCによるハードウェアエンコードの速度もチェックしよう。動画編集アプリの「DaVinci Resolve Studio 18.6」を使って、Apple ProResの4K素材を使ったプロジェクト(約2分)をH.265とAV1にNVENCを使って変換する速度を測定した。品質:80Mbps/Rate Control:固定ビットレート/Preset:速度優先の設定でエンコードを実行している。
RTX 4070 Ti/RTX 4070 Ti SUPER/RTX 4080はNVENCを2基搭載しており、DaVinci Resolve STUDIO 18.6はそれを同時使用するデュアルエンコードが可能なので処理時間は非常に短い。RTX 4070 SuperとRTX 4070は同じNVENCが1基搭載なので処理速度はほぼ同じとなった。
強烈に冷える大型クーラー
最後に温度とクロックの推移をチェックしよう。サイバーパンク2077を10分間プレイした際の温度と動作クロックの推移を「HWiNFO Pro」で測定している。GPU温度は「GPU Temperature」、クロックは「GPU Clock」の値だ。室温は22度。バラック状態で動作させている。
ブーストクロックは2,700MHz前後で推移。仕様上のブーストクロック2,640MHzなので、ゲーム中はそれよりも高クロックで動作しているのが分かる。そして注目は温度だ。さすが3連ファンで3.1スロット厚の大型クーラーを搭載しているだけに、最大64.5度、平均61.4度と強烈に冷えている。このクラスのGPUが70度以下で動き続けるのは、クーラーがかなり強力な証拠と言ってよい。
まとめると、RTX 4070 Ti SUPERは、RTX 4070 Tiに対して実ゲームで概ね5~10%のフレームレート向上が確認でき、順当な強化を果たしたと言ってよいだろう。カード電力は同じなので、RTX 4070 Tiと同じカードサイズで設計できるのもよいところ。RTX 4080 / RTX 4090搭載カードよりも取り回しやすい製品が多くなるハズだ。その一方で、RTX 4080に対してはまだ10~15%の性能差がある。価格面で、どこまでRTX 4070 Ti寄りにできるかが人気の決め手になってくるだろう。