NVIDIAは、米国時間の9月18日、同社最新GPUアーキテクチャ"Maxwell"(マクスウェル)を採用するフラグシップGPUとなる「GeForce GTX 980」と、その下位モデルとなる「GeForce GTX 970」を発表、同日発売を開始した。この両製品は、同社が開発コードネーム"GM204"と呼ぶ、現時点ではMaxwellアーキテクチャの最上位チップを採用した製品となる。
■「GeForce GTX 980」のレビュー記事はこちら
【レビュー】第2世代Maxwellベースの「GeForce GTX 980」を試す - 新旧ハイエンドとの比較で実力を探る
GM204のアーキテクチャ
GM204は、今年2月に発表された初のMaxwellアーキテクチャ採用GPU"GM107"こと、GeForce GTX 750 Tiと、基本的なアーキテクチャには違いはない。Maxwellアーキテクチャでは、GPU内部における演算処理の実行単位となる、複数のCUDAコアをまとめたSM(Streaming Multiprocessor)の構成を見直し、より効率的にCUDAコアを利用できるようにすることで、同じCUDAコア数でも処理性能を向上させている。
GeForce GTX 980 | GeForce GTX 680 | GeForce GTX 780 Ti | |
---|---|---|---|
アーキテクチャ | Maxwell | Kepler | Kepler |
GPUコア(開発コードネーム) | GM204 | GK104 | GK110 |
製造プロセス | TSMC 28nm | TSMC 28nm | 28nm |
ダイサイズ | 398平方mm | 294平方mm | 533平方mm |
トランジスタ数 | 52億 | 35億4000万 | 71億 |
SM | 16 | 8 | 15 |
CUDAコア | 2048 | 1536 | 2688 |
ベースクロック | 1126MHz | 1006MHz | 875MHz |
GPU Boostクロック | 1216MHz | 1058MHz | 928MHz |
TFLOPS(GPUブースト最大時) | 5TFLOPS | 3.3 | 5.5TFLOPS |
テクスチャユニット | 128 | 128 | 240 |
テクセルフィルレート | 144.1Gtexels/sec | 129Gtexels/sec | 210Gtexels/sec |
L2キャッシュ | 2MB | 512KB | 1.5MB |
メモリクロック | 700MHz | 600MHz | 700MHz |
メモリ帯域 | 224GB/sec | 192GB/sec | 336GB/sec |
メモリインターフェース | GDDR5 256bit | GDDR5 256bit | 384bit |
ROP | 64 | 32 | 48 |
TDP | 165W | 195W | 250W |
具体的には、GeForce GTX 680で採用されたKeplerアーキテクチャでは、192基のCUDAコアでSMを構成していたのに対し、Maxwellアーキテクチャでは128基のCUDAコア構成に変更。さらにSMの内部を32コアごとにプロセシングブロック(PB)と呼ぶGPU処理の実行単位に4分割し、それぞれにコントロールロジックとなるWarpスケジューラと2つの命令発行ユニット(ディスパッチユニット)、64KB(16,384×32bit)のレジスタファイルを持たせることで、命令発行の効率化を図っている。また、Maxwellアーキテクチャでは、このプロセシングブロックごとにクロック制御を行なうことができるとされ、低負荷時の省電力化も図りやすい設計となっている。
GM204の半導体製造プロセスは、GeForce GTX 680や、GeForce GTX 780 Tiと同じTSMCの28nm HPプロセスのまま変更はない。GM204は同プロセスで52億トランジスタを集積し、2,048基のCUDAコアを398平方mmのダイに収めている。このサイズは、GeForce GTX 680に採用されたGK104と、Keplerアーキテクチャの最上位モデルとなるGK110の中間にあたるサイズだ。
同社でGPUアーキテクチャの開発を指揮するジョナ・アルベン上級副社長(Jonah Alben, Senior Vice President, GPU Hardware Engineering)によれば、「Maxwellアーキテクチャでは、TegraからGeForce、Teslaに至るワイドレンジの製品に適用できるよう、高性能かつ低消費電力のグラフィックスチップを実現することを最大の目標に開発を続けてきた」とし、GeForce GTX 680に採用されたGK104に比べて2倍のパフォーマンスを実現するとアピール。CUDAコアの利用効率を高めるとともに、製造プロセスの成熟などによりGPUクロックも大幅に引き上げることができたことで、GeForce GTX 980では、GK104ベースのGeForce GTX 680の1,538 CUDAコアから、約30%増の2,048コア構成ながら、演算性能で約70%アップの5TFLOPSを実現するとともに、3Dグラフィックスパフォーマンスは2倍を実現。その一方で、消費電力はGeForce GTX 680の195Wから165Wに低減され、消費電力あたりの演算性能は30GFLOPS/Wと、Keplerアーキテクチャの倍の省電力性能を実現している。
グラフィックスパフォーマンスの向上においては、GM204に搭載された新しいメモリコントローラも一役買っている。アルベン氏によれば、「GM204では、NVIDIAにとって第3世代となるカラー圧縮技術を採用することで、メモリ帯域を約25%低減することを可能にした」と説明、より低負荷で4Kなどの高解像度描画ができるようにも工夫されていると言う。
また、アルベン氏は「GM204では、H.265(HEVC)エンコードに対応するほか、HDMI 2.0に対応し、4K 60Hz表示や5K表示もサポートする」と説明するように、GM204では、ビデオエンジンも大幅に強化された。GeForce GTX 980のリファレンスデザインでは、Display Port×3、HDMI×1、Dual Link DVI-I×1の5つのディスプレイ出力端子を備え、このうち4つの端子から同時出力が可能だ。また、DisplayPort MSTハブなどを利用することで、最大7画面出力を可能にするほか、Display Portでは最大5,120×3,200ピクセル/60Hzの5K出力もサポートする。HDMIポートはHDMI 2.0に対応し、"4:4:4"のRGB出力に対応し、DisplayPort出力と組み合わせて、最大4画面の4K出力を可能にする。
さらに、GM204に統合されたH.265ビデオエンコーダは、従来のH.264ビデオエンコーダに比べて2.5倍のスループット性能を持ち、4Kビデオを60fpsでエンコードすることもできるようになると言う。現時点では、この新しいビデオエンジンに対応したアプリケーションなどの情報は公開されていないが、今後、同GPUのH.265エンコーダを有効にしたアプリケーションも増えていくはずだ。