NVIDIAは10月29日(北米現地時間)、DirectX 10世代、プログラマブルシェーダ4.0仕様(SM4.0:Shader Model4.0)対応のGPU「GeForce 8800 GT」を発表した。

本稿では、NVIDIA本社のあるサンタクララで行われた先行技術説明会「NVIDIA EDITORS' DAY」の内容を元に、GeForce 8800 GTについての詳細をお届けする。

NVIDIA EDITORS' DAYの会場風景

65nm製造プロセスルール採用で高クロック、省電力化

今回発表されたGeForce 8800 GTは開発コード名「G92」とされたGPUで、冒頭でも述べたようにDirectX 10世代、プログラマブルシェーダ4.0仕様対応のGPUになる。

Windows Vista Service Pack1(SP1)のリリースを目前に控えたタイミングであったため、SP1提供と同時にリリースされるとされているDirectX 10.1世代/SM4.1対応のGPUが登場するという噂も流れたが、蓋を開けてみればGeForce 8800 GTX/Ultra(G80)のリファイン版であった。

NVIDIA GeForce 8800 GT

GeForce 8800 GTX/Ultraは90nmプロセスによる製造であったが、今回のGeForce 8800 GTでは1世代シュリンクした65nmプロセスで製造される。総トランジスタ数は7億5400万。GeForce 8800 GTX/Ultraの6億8100万よりも7300万多い計算だ。

これにより、GeForce 8800 GTではコアクロックが600MHz、シェーダクロックは1.5GHzという高クロック動作を標準仕様としている。Ujesh Desai氏(GeForce General Manager, NVIDIA)によれば、「動作クロックのマージンには余裕がある」としており、カートベンダーによってはより高い動作クロックを設定した製品も投入される見込みだ。

Ujesh Desai氏(GeForce General Manager, NVIDIA)

GeForce 8800 GTの汎用シェーダユニット(SP:Stream Processor)は112基、ROP(Rendering Output Pipeline)ユニットは16基とされた。GeForce 8800 GTX/UltraではSPは128基、ROPは24基あったので、GeForce 8800 GTは上位よりもSPが16基、ROPは8基少ないことになる。

GeForce 8000シリーズでは汎用シェーダ16基単位を1ブロック(クラスタ)として形成させる設計となっていた。GeForce 8800 GTX/UltraとGeForce 8800 GTのブロックダイアグラムを比較すると分かるが、このクラスタがGeForce 8800 GTX/Ultraでは8つ、8800 GTでは7つで、GeForce 8800 GTの方が1つ少ないことが分かる。

同様にROPも、GeForce 8800 GTX/Ultraが6クラスタあったのに対し、8800 GTでは4クラスタに削減されている。

GeForce 8800 GTのブロックダイアグラム

GeForce 8800 GTX/Ultraのブロックダイアグラム(参考)

以上の理由で、動作クロック的にはGeForce 8800 GTXよりも上の8800 GTだが、パフォーマンス的には8800 GTXを超えられない局面が多くなりそうだ。

ビデオメモリバス幅はROPクラスタの個数と密接に関わりがあるため、やはりGeForce 8800 GTでは256ビットへと縮小されている。GeForce 8800 GTX/Ultraでは384ビットで、8800 GTの方が128ビット狭いことになる。

なお、GeForce 8800シリーズの基本的なアーキテクチャについてはこちらの記事を参照していただきたい。

2007年10月時点の最新ハイエンドGPU基本スペック比較(一部筆者推測)

※1 マルチクロックドメイン設計のため汎用シェーダは別クロックで動作する