既報の通りAMDは2011年12月22日に28nmプロセスを使ったRadeon HD 7970を発表した。もっとも発表は2011年12月でも、発売は2012年1月で、しかも価格は現時点でもまだ不明という状態ではあるが、それでもTSMCの28nm HKMGプロセスを使ったコンシューマ向け製品としては初めてのものとなる。残念ながら日本で最速とはならなかったが、やっと筆者も評価キットを入手することが出来たので、まずは性能についてのレポートをお届けしたい。

構成のおさらい

既に上のレポートで主要な特徴については語られているが、一応おさらいということで主要な特徴をもう一度整理してみたい。AMDの28nm世代は、Tahiti/Pitcairn/Cape Verdeの3種類のコアが現時点で明らかにされている。もっともSouthern Islandファミリーはこの3種類で全て、とはAMDは言っていない。TahitiはRadeon HD 6900ファミリーの後継となるハイエンド、PitcairnはRadeon HD 6800ファミリーとRadeon HD 6700ファミリーの両方の後継となることは内容からも明らかだが、問題はローエンドのCape VerdeがRadeon HD 6500/6600シリーズの後継でしかなく、その下のRadeon HD 6400ファミリーに相当するものがこのままでは空いてしまう形になる。

Photo01: ちなみにここにかかれていない話として、ハイエンドのRadeon HD 7990はNew Zealandというコード名になる模様。

もう少し判りやすくしたのが表1である。Northern Islands世代では5種類のコアを投入して製品ラインナップを構成していたが、Southern Islands世代ではこれが3種類になるという話だと、特にバリュー向けの作り分けが難しくなる様に思える。このため、後追いでCape Verdeの更に下位モデルが投入されるのではないかと筆者は想像している。

■表1
分類 40nm Northern Island 28nm Southern Island
エンスージャスト RADEON HD 6900(Cayman) RADEON HD 7900(Tahiti)
ハイパフォーマンス RADEON HD 6800(Barts) Pitcairn
メインストリーム RADEON HD 6700(Jupiter)
RADEON HD 6500/6600(Turks)
Pitcairn?
Cape Verde
バリュー RADEON HD 6400(Caicos) Cape Verde?

さてそのSouthern Islandsの特徴がこちらである(Photo02)。一番大きいのがGCN(Graphics Core Next)と呼ばれる新アーキテクチャだが、他にAMD Eyefinity 2.0やAMD App Accelerationなども追加されている。

Photo02: ただこの特徴が「全ての」Southern Islandsに適用されるかどうか、はまだ不明。

そのSouthern Islandsの最初の製品が、今回発表になったRadeon HD 7970である(Photo03)。GCNはAMDの数え方からすると第4世代にあたる(Photo04)という事になるようであり、そのGCNを最初に搭載したのがこのRadeon HD 7970となる(Photo05)。このGCNというアーキテクチャが最初に発表されたのは2011年6月に開催されたAFDS(AMD Fusion Developer Summit)のこと。ここにおけるEric Demers氏(AMD Corporate Vice President and CTO, Graphics Division)の基調講演で存在が明らかにされた。

Photo03: Radeon Coreという言い方がなくなり、再びStream Processorsという名称になっている。

Photo04: VLIW5とVLIW4はどちらも第3世代という扱い。確かにGCNに比べれば小変更ではある。

Photo05: GCNのものすごくラフなブロック。これはGCNをグラフィック演算を行わせる場合にはどう見えるか、という図のようだ。

GCNの基本単位はCompute Unit(CU)であり、ここにはScalar/Vectorの各演算ユニットその他が統合される(Photo06)。更に64KBのLDS(Load/Store)Memoryや、4つのCU毎に共有という形ながら、16KBのRead Only L1や32KBのI-L1も搭載されるなど、かなり重厚な装備である。これをCPUからみると、MIMD/SIMD/SMTのいずれの使い方も可能で、これをCU単位で切り替えることも可能である。勿論3Dグラフィック描画の場合は、各々のCUの中でそれぞれの役割を決めて処理を分割して実施する形になる。このあたりの詳細は現時点でもまだ公開されていないが、AMDによればVILW4世代と比較しても効率がずっと良くなったとの事であった。

Photo06: これ全体がCU。Photo05のブロックの中にはこのCUが32個入っている計算になる。

Photo07: これは同時に可能、という訳ではなくアプリケーションの要件に応じて任意のI/Fが利用できるという意味。

Photo08: Radeon HD 7970の場合、32 CUで合計2048 ComputeShaderが利用できるという話になっているから、CUあたり64 ComputeShaderである。

さてついでに他の特徴を。主要な特徴として挙げられているのはこちら(Photo09)である。後述するとおり、Radeon HD 7970では待機時の消費電力は大幅に削減されている一方、フル稼働時の最大消費電力はRadeon HD 6970が250Wなのに対し、Radeon HD 7970では260Wとやや引き上げられている。なので放熱に関しては多少能力を強化する必要があり、ファンやヒートシンクも改善されている。もっとも騒音に関しては、体感ではそれほど大きな差は感じなかった。

Photo09: DualBIOSは、Radeon HD 6990などにも装備されていたもの。

さてその消費電力である(Photo10)。上で述べたようにRadeon HD 7970の定格動作における最大消費電力は260Wであるが、ボード上の電源回路は最大300Wまで対応しているとかで、そこまで性能を伸ばせるという話である。その一方、待機時の消費電力は大幅に引き下げることに成功している(Photo11)。絶対的な消費電力という意味でも、Radeon HD 7970ではコアの消費電力は待機時には3W未満まで落ちるとしている(Photo12)。逆にオーバークロックに関しては、1GHzを超えることも現実的という説明であった(Photo13)。

Photo10: なんでRadeon HD 5870を引き合いに出すのか? はちょっと不明。

Photo11: ちなみにCrossFire動作時にアイドル状態になった場合、Primary側のGPUのみを稼働させ、Secondary側はファンも含めて停止することで、消費電力と騒音の削減を実現している。

Photo12: 単にこれはプロセス側(TSMCの28nm HKMG)のみならず、Power Gatingまで実装してここまで実現できたという話。ただ実際にはGDDR5メモリとか電源部自身の消費電力などもあるから、もう少し消費電力は大きくなる。

Photo13: もともとのコアクロックが925GHzだから、1GHzまで引き上げてどこまで性能が改善するか? というのはちょっと微妙なところ。