DLSS 3はフレームレート向上&消費電力軽減

次は、レイトレーシングとDLSS 3の性能を含めたテストを行おう。DLSSはGeForce RTXシリーズで利用できる高い画質を保ったまま描画負荷を軽減できるアップスケーラーとして知られているが、そこにTensorコアを利用したフレーム生成技術を追加して、さらにフレームレートを向上できるようにしたのがDLSS 3だ。フレーム生成はGPU側で行うため、CPUパワーが不足しているような状況でもフレームレートを向上できるのも強み。

なお、第4世代のTensorコアが必要になるため、DLSS 3は現在のところRTX 40シリーズだけで利用できる。それ以外のRTXシリーズはDLSS 2までの対応だ。

  • 従来のアップスケーラーにフレーム生成技術を加えたのがDLSS 3。すでに35以上のゲームやアプリで対応を発表している

まずは、DLSS 3に対応するベータ版のサイバーパンク2077から試していこう。テストは最高画質設定の「レイトレーシング:ウルトラ」をベースに、レイトレーシングライティング設定をもっとも高い「サイコ」にし、ゲーム内のベンチマーク機能を実行した際のフレームレートを「FrameView」で測定している。

  • ベータ版サイバーパンク2077には、DLSS 3の特徴であるフレーム生成を有効にする「DLSS Flame Generation」という項目が追加される。RTX 40シリーズ以外では設定を有効にできない

  • サイバーパンク2077

  • サイバーパンク2077の消費電力(カード単体)

サイバーパンク2077は、2年以上前に登場したゲームだが、現在でも最重量と言える描画負荷の高さ。しかし、DLSS 3(アップスケール+フレーム生成)を利用すれば、RTX 4070 Tiでも4K解像度で平均87fpsに到達と、レイトレーシングを最大限効かせても十分快適にプレイできるフレームレートを出せる。RTX 3080 Tiはフレーム生成を利用できないため、DLSS 3非対応ゲームに比べてRTX 4070 Tiとのフレームレート差は大きくなるのがポイントだ。

また、カード単体の消費電力にも注目したい。DLSSのパフォーマンス設定は内部のレンダリング解像度は4分の1(4KならフルHD)になるため描画負荷は軽減する。そのため消費電力はDLSSを使っていない状況よりも少なくなる。フレームレートは向上する、消費電力は下がるとDLSS 3は非常に優秀な技術だ。ちなみにRTX 30シリーズはDLSSを有効にしても消費電力が下がらないのは、内部のレンダリング解像度が下がってもサイバーパンク2077の描画負荷が重すぎて、消費電力が下がらないと見られる。なお、RTX 3080の4K解像度の消費電力が低いのは、性能不足で描画処理しきれていないのが影響していると思われる。

次はアップデートにてDLSS 3に正式対応したF1 22だ。画質、レイトレーシングとも最高の「超高」に設定、ゲーム内のベンチマーク機能(バーレーン&晴天に設定)を実行した際のフレームレートを「FrameView」で測定している。

  • DLSS 3対応によってビデオモードの設定に「DLSS Flame Generation」が加わった

  • F1 22

  • F1 22の消費電力(カード単体)

DLSSをパフォーマンス設定にすることで、4Kで約2.6倍、WQHDで約2.3倍、フルHDで約2.1倍のフレームレート向上を確認とDLSS 3の威力がよく分かる結果だ。4Kは平均143fps出ており、4K/144Hzのゲーミング液晶を十分活かせるフレームレート。DLSS 3に対応しているゲームなら、RTX 4070 Tiは4Kゲーミングを余裕で楽しめると言ってよさそうだ。消費電力はサイバーパンク2077と同じ傾向。解像度が下がるごとに消費電力も下がっていく。RTX 30シリーズもサイバーパンク2077ほど描画負荷が高くないせいか、DLSSを有効すると若干だが消費電力が下がるのを確認できた。

最後に、11月12日の大型アップデートでDLSS 3に正式対応した「Microsoft Flight Simulator」を試して見よう。アクティビティの着陸チャレンジから「シドニー」を選び、60秒フライトしたときのフレームレートを「FrameView」で測定している。

  • 大型アップデートでDLSS 3の「NVIDIA DLSS フレーム生成」が追加された

  • Microsoft Flight Simulator

  • Microsoft Flight Simulatorの消費電力(カード単体)

Microsoft Flight SimulatorはCPU負荷の非常に大きい。そのため、CPUパワーが不足している状況でもGPU側でフレーム生成するのでフレームレートが向上できる、というDLSS 3の強みが出るタイトルだ。RTX 30シリーズはフレーム生成に対応できないので、フルHD、WQHDではCPUパワー不足でDLSSを有効にしてもフレームレートがほとんど伸びない。その一方でRTX 40シリーズなら、DLSSを有効することで大きくフレームレートを向上できる。

消費電力に関しては、CPUがボトルネックになってGPUに負荷がかかりきらないため、DLSSを使っていない状況でも少なめ。それでもDLSSを使えば、きっちり消費電力は下がる。RTX 30シリーズとの消費電力差はここでも大きく、RTX 40シリーズのワットパフォーマンスのよさがここでもよく分かる。

デュアルエンコードはRTX 4070 Tiでも健在

ここからはクリエイティブ系の処理をテストしていこう。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を試す。

  • Blender Open Data Benchmark

一定時間内にどれほどレンダリングできるのかをスコアとして出すベンチマークだ。RTX 3080に対して最大1.4倍、RTX 3080 Tiに対して最大1.25倍のスコアを出した。RTX 4080に対しては2~3割減とゲームと同じ傾向だ。

続いて、デュアルエンコードに対応する動画編集アプリの「DaVinci Resolve 18」(テスト版)を使って、Apple ProResの4Kと8K素材を使ったプロジェクト(約2分)をそれぞれH.265とAV1に変換する速度を測定してみた。品質:80Mbps/Rate Control:固定ビットレート/Preset:速度優先の設定でエンコードを実行している。

  • DaVinci Resolve 18 - 4K

  • DaVinci Resolve 18 - 8K

RTX 4090/4080と同じく、ハードウェアエンコーダーのNVENCを2基備えており、それを同時に使うデュアルエンコードにも対応。RTX 30シリーズに比べて圧倒的な速さでエンコードを完了できる。また、高圧縮&高画質のコーデックであるAV1のハードウェアエンコードにも対応しているのも大きな強み。YouTubeなどの動画配信サービスが今後AV1への対応を予定しているだけに、ゲーム実況などの動画投稿を考えている人にとってもRTX 4070 Tiは魅力的に映るハズだ。