9000番台に達したNVIDIA GeForceシリーズが命名規則もリフレッシュ。新シリーズ「GTX 200」が発表された。GeForce GTX 200シリーズは、同社第2世代となるユニファイドシェーダを搭載するほか、内部アーキテクチャも細かに変更されている。アーキテクチャの詳細解説は別記事に任せるとして、ここではまずそのパフォーマンスをテストしてみたい。

GeForce GTX 280の仕様を従来シリーズと比較

GPU GTX 280 GTX 260 9800 GTX 9800 GX2 8800 Ultra
製造プロセス 65nm 65nm 65nm 65nm 90nm
トランジスタ数(billion) 1.4 1.4 0.75 1.5 0.68
GPUコアクロック 602MHz 576MHz 675MHz 600MHz 612MHz
シェーダクロック 1296MHz 1242MHz 1688MHz 1500MHz 1500MHz
シェーダ数 240 192 128 128x2 128
メモリクロック(MHz) 1107(DDR:2214) 999(DDR:1998) 1100(DDR:2200) 1000(DDR:2000) 1080(DDR:2160)
メモリインタフェース(Bit) 512 448 256 256/GPU = 512 Bit 384
メモリ帯域幅(GB/sec) 141.7 111.9 70.4 64/GPU = 128 GB/s 103.7
メモリ容量 1GB 896MB 512MB 512MB/GPU = 1GB 768 MB
ROPユニット数 32 28 16 16/GPU = 32 24
テクスチャ・フィルタリング・ユニット数 80 64 64 64/GPU = 128 64
テクスチャ・フィルレート(billion/sec) 48.2 36.9 43.2 38.4/GPU = 76.8 B/s 39.2

上記の表はGeForce GTX 280を最近のGeForceシリーズ製品と比較したものだ。GeForce GTX 280の製造プロセスはGeForce 9シリーズと同様の65nmでここは共通だ。トランジスタ数は単体のGPUとしてはかなり大規模で、GeForce 9800 GTXの2倍にも近い14億個となっている。そしてシェーダプロセッサ数は240。8基のストリームプロセッサがひとかたまりとなって「Streaming Multiprocessors」を構成し、これが3基まとめてひとつの「Thread Processing Clusters」を構成する。このThread Processing Clusters(TPC)を10基持つのがGeForce GTX 280でSPは240基となり、TPCが8基のものがGeForce GTX 260でSPは192基となる。ちなみに、シェーダを増加させただけでなく、シェーダ自体の性能もGeForce 8/9世代よりも増しているとNVIDIAでは説明している。

基本的にトランジスタ数が増えれば発熱も増加するのだが、その影響なのかコアクロックとシェーダクロックは比較的おとなしい。しかしメモリに関してはシリーズ最速のものを採用している。しかもメモリ接続バス幅が拡大され、512bit接続となっているところがポイントだ。これにより、メモリ帯域幅はGeForce 9800 GTXの2倍となる141.7GB/sec。384bit接続だったGeForce 8800 Ultraなどと比較してみても4割り増しという内容だ。容量も1GBとなる。容量増に関しては、それだけテクスチャを大量に格納できるという側面もあるし、あるいは接続ビット幅を拡大したために仕方ないという見方もできるだろう。