GeForce GTX 980/970詳報、第2世代MaxwellことGM204コアのアーキテクチャを解説

NVIDIAは、米国時間の9月18日、同社最新GPUアーキテクチャ"Maxwell"(マクスウェル)を採用するフラグシップGPUとなる「GeForce GTX 980」と、その下位モデルとなる「GeForce GTX 970」を発表、同日発売を開始した。この両製品は、同社が開発コードネーム"GM204"と呼ぶ、現時点ではMaxwellアーキテクチャの最上位チップを採用した製品となる。

■「GeForce GTX 980」のレビュー記事はこちら
【レビュー】第2世代Maxwellベースの「GeForce GTX 980」を試す - 新旧ハイエンドとの比較で実力を探る

GM204のアーキテクチャ

GM204は、今年2月に発表された初のMaxwellアーキテクチャ採用GPU"GM107"こと、GeForce GTX 750 Tiと、基本的なアーキテクチャには違いはない。Maxwellアーキテクチャでは、GPU内部における演算処理の実行単位となる、複数のCUDAコアをまとめたSM(Streaming Multiprocessor)の構成を見直し、より効率的にCUDAコアを利用できるようにすることで、同じCUDAコア数でも処理性能を向上させている。

	GeForce GTX 980	GeForce GTX 680	GeForce GTX 780 Ti
アーキテクチャ	Maxwell	Kepler	Kepler
GPUコア(開発コードネーム)	GM204	GK104	GK110
製造プロセス	TSMC 28nm	TSMC 28nm	28nm
ダイサイズ	398平方mm	294平方mm	533平方mm
トランジスタ数	52億	35億4000万	71億
SM	16	8	15
CUDAコア	2048	1536	2688
ベースクロック	1126MHz	1006MHz	875MHz
GPU Boostクロック	1216MHz	1058MHz	928MHz
TFLOPS(GPUブースト最大時)	5TFLOPS	3.3	5.5TFLOPS
テクスチャユニット	128	128	240
テクセルフィルレート	144.1Gtexels/sec	129Gtexels/sec	210Gtexels/sec
L2キャッシュ	2MB	512KB	1.5MB
メモリクロック	700MHz	600MHz	700MHz
メモリ帯域	224GB/sec	192GB/sec	336GB/sec
メモリインターフェース	GDDR5 256bit	GDDR5 256bit	384bit
ROP	64	32	48
TDP	165W	195W	250W

具体的には、GeForce GTX 680で採用されたKeplerアーキテクチャでは、192基のCUDAコアでSMを構成していたのに対し、Maxwellアーキテクチャでは128基のCUDAコア構成に変更。さらにSMの内部を32コアごとにプロセシングブロック(PB)と呼ぶGPU処理の実行単位に4分割し、それぞれにコントロールロジックとなるWarpスケジューラと2つの命令発行ユニット(ディスパッチユニット)、64KB(16,384×32bit)のレジスタファイルを持たせることで、命令発行の効率化を図っている。また、Maxwellアーキテクチャでは、このプロセシングブロックごとにクロック制御を行なうことができるとされ、低負荷時の省電力化も図りやすい設計となっている。


GM204のフル機能を実装するGeForce GTX 980のブロックダイヤグラム	GK104のフル機能を実装したGeForce GTX 680のブロックダイヤグラム

GM204のSMの特徴。GK104に対して2倍の省電力性能を実現すべく、効率の追究がなされている


GM204のSM構成	Kepler GK104のSMX構成

GM204の半導体製造プロセスは、GeForce GTX 680や、GeForce GTX 780 Tiと同じTSMCの28nm HPプロセスのまま変更はない。GM204は同プロセスで52億トランジスタを集積し、2,048基のCUDAコアを398平方mmのダイに収めている。このサイズは、GeForce GTX 680に採用されたGK104と、Keplerアーキテクチャの最上位モデルとなるGK110の中間にあたるサイズだ。

GM204アーキテクチャについて説明するジョナ・アルベン上級副社長

同社でGPUアーキテクチャの開発を指揮するジョナ・アルベン上級副社長(Jonah Alben, Senior Vice President, GPU Hardware Engineering)によれば、「Maxwellアーキテクチャでは、TegraからGeForce、Teslaに至るワイドレンジの製品に適用できるよう、高性能かつ低消費電力のグラフィックスチップを実現することを最大の目標に開発を続けてきた」とし、GeForce GTX 680に採用されたGK104に比べて2倍のパフォーマンスを実現するとアピール。CUDAコアの利用効率を高めるとともに、製造プロセスの成熟などによりGPUクロックも大幅に引き上げることができたことで、GeForce GTX 980では、GK104ベースのGeForce GTX 680の1,538 CUDAコアから、約30%増の2,048コア構成ながら、演算性能で約70%アップの5TFLOPSを実現するとともに、3Dグラフィックスパフォーマンスは2倍を実現。その一方で、消費電力はGeForce GTX 680の195Wから165Wに低減され、消費電力あたりの演算性能は30GFLOPS/Wと、Keplerアーキテクチャの倍の省電力性能を実現している。


"GM204"アーキテクチャの特徴	従来のGeForce GPUとの省電力性能比較

グラフィックスパフォーマンスの向上においては、GM204に搭載された新しいメモリコントローラも一役買っている。アルベン氏によれば、「GM204では、NVIDIAにとって第3世代となるカラー圧縮技術を採用することで、メモリ帯域を約25%低減することを可能にした」と説明、より低負荷で4Kなどの高解像度描画ができるようにも工夫されていると言う。


GM204では、メモリコントローラも改良され、カラー圧縮率が向上、メモリ帯域を大幅に節約することが可能になった	カラー圧縮と、キャッシュ効率の改善などにより、メモリ帯域は約25%向上するとアピール


NVIDIAにとって第3世代のメモリ圧縮技術によって、大半のカラー情報は圧縮できるようになる。ピンク色で示された部分が、圧縮されたカラー情報だ

また、アルベン氏は「GM204では、H.265(HEVC)エンコードに対応するほか、HDMI 2.0に対応し、4K 60Hz表示や5K表示もサポートする」と説明するように、GM204では、ビデオエンジンも大幅に強化された。GeForce GTX 980のリファレンスデザインでは、Display Port×3、HDMI×1、Dual Link DVI-I×1の5つのディスプレイ出力端子を備え、このうち4つの端子から同時出力が可能だ。また、DisplayPort MSTハブなどを利用することで、最大7画面出力を可能にするほか、Display Portでは最大5,120×3,200ピクセル/60Hzの5K出力もサポートする。HDMIポートはHDMI 2.0に対応し、"4:4:4"のRGB出力に対応し、DisplayPort出力と組み合わせて、最大4画面の4K出力を可能にする。

4K×4画面出力にも対応するGeForce GTX 980のディスプレイ出力部。HDMIは4K/60Hz出力をサポートするHDMI 2.0対応となった

さらに、GM204に統合されたH.265ビデオエンコーダは、従来のH.264ビデオエンコーダに比べて2.5倍のスループット性能を持ち、4Kビデオを60fpsでエンコードすることもできるようになると言う。現時点では、この新しいビデオエンジンに対応したアプリケーションなどの情報は公開されていないが、今後、同GPUのH.265エンコーダを有効にしたアプリケーションも増えていくはずだ。