Sandra 2009 SP4 Engineer Edition

SiSoftware
http://www.sisoftware.co.uk/

ではまず基本的なところで、Sandraから行こう。いつもだとArithmetic Benchmarkなどを示すわけだが、今回はGPU周りの比較なので、SandraのGPU Benchmarkの結果をご紹介したい。

グラフ1と2はVideo Renderingの比較である。グラフ1はFloat、グラフ2はDoubleでの比較となる。GeForce系がDX 10.1でのスコアが無いのは、まだDirectX 10.1に未対応なためだ。さて、結果を見ると確かにRadeon HD 5870はRadeon HD 4870比でほぼ2倍の性能向上を(どのAPIでも)果たしていると言っていいだろう。ことFloatに関しては、それでもまだ若干GeForce GTX 285に及ばない部分はあるが、Doubleでは圧倒しており、何か大昔のRAGE 128 vs RIVA TNTを髣髴させる結果になっている。ちなみにGeForce GTX 295で異様にスコアが悪いのは、コア間でのデータのやり取りがあるからだと想像される。おそらくはSLIを無効にすればここのスコアはもう少し良くなると思うが、それでは何のためのDual GPUか判らないのでSLIは有効のままとしている。

グラフ3はGPGPUとしての性能だ。ここでは、RadeonはAMD STREAM、GeForceはCUDAを使い、マンデンブロ図形描画を行っている。ここでもRadeon HD 4870比でほぼ2倍の性能であり、GeForce GTX 295と比較しても良いスコアをだしているのは面白い。ちなみにこれはFloatの場合で、Doubleの場合だと極端に大きな性能差になるのも興味深い。

グラフ4は内部、つまりオンボードメモリへのアクセス性能、グラフ5は外部、つまりPCのメインメモリへのアクセス性能である。まずグラフ4を見るとRadeon HD 4870が44GB/sec、Radeon HD 5870が88GB/secとなっている。それぞれの理論上のピークはPhoto13に示すとおり115GB/sec、153GB/secだから、効率はそれぞれ38%、58%という計算になる。絶対的なピーク性能では、まだGeForce GTX 285に敵わない(GeForce GTX 295が低めに出ているのは、相変わらずSLIのためだろうと想像される)ものの、確かに将来に向けてのヘッドルームがまだあることを物語っている。実は発表会の折にZvika Greenstein氏(Manager, Product Marketing, Desktop Discrete Graphics Division)に「この世代は256bitで良いとして、次の世代はどうするんだ?」と聞いたところ「GDDR5の動作周波数は6Gbpsまで上げられるし、まだEfficiencyを高める事ができるから心配するな(笑)」という返事が返ってきた。まぁ確かに、GDDR5を6Gbpsまでスピードアップし、かつ効率を92%位まで引き上げることが出来れば、176GB/secの帯域を確保できるという計算は成立する。次世代、というのはおそらく28nmプロセスを使い、SPの数が3200個とかそーいうお化けチップになるのだろうが、そこまでは256bitバスで間に合う、ということの様だ。

話を戻すとグラフ5はSystem Memoryへのアクセスである。理論上は8GB/secとなるが、System to Device(つまりメインメモリからGPUへの転送)が5GB/secあたりで並んでいるのは、グラフィックスカード云々よりもチップセット側の制限の様に思える。逆にDevice to System(GPUからメインメモリへの転送)はRadeonとGeForceで大きく分かれるが、これはもうRadeon系の癖なのであろう。