ベンチマークPart 2:内蔵グラフィックス

さて、次は内蔵GPUを利用したケースでの比較を行ってみたい。Core i7-3960Xは利用できないので、ここからはCore i7-2700KとCore i7-3770Kの2製品での比較となる。ちなみにRMMAに関しては、一応テストは行って結果を確認したものの、殆ど差がなかったので、こちらでは割愛する。

Sandra 2012 Engineer Edition(グラフ110~124)

まずはSandra。グラフ110と111がそれぞれDhrystoneとWhetstoneでの比較となるが、むしろCore i7-3770Kの方がやや上回る性能を出しているのが判る。もっと正確に言えば、Core i7-2770Kは内部GPUでそれほど性能差が無いのに対し、Core i7-3770Kでは内蔵GPUを使うとむしろ性能が伸びている。グラフ1・2からDhrystone iSSE4.2とWhetstone iSSE3の値を抜き出してみると、

Dhrystone(GIPS) Whetstone(GFLOPS)
外部GPU 内部GPU 外部GPU 内部GPU
Core i7-2700K 152.64 153.40 93.69 93.84
Core i7-3770K 147.08 155.09 92.88 97.52

という、ちょっと不思議な結果になっている。もっともこの傾向はDhrystone/Whetstoneに留まらない。Processor Multi-Media(グラフ112)でもCore i7-3770KのスコアはCore i7-2700Kと同等以上である。Cryptgraphy(グラフ113)ではまだ若干のビハインドはあるが、その差はずっと小さくなっている。

Multi-core Efficiency(グラフ114)の結果はほぼ同等。Detail(グラフ115)を見ると、僅かながらCore i7-3770Kが上回る部分が多い結果になっている。Memory Bandwidth(グラフ116)を見ると、Streamの結果はまだCore i7-2700Kが上回っているが、Cache&Memory Bandwidth(グラフ117)ではむしろCore i7-3770Kが全般的に少し帯域が増えているのが判る。Latency(グラフ118~120)についても、L1では完全に同等、L2~LLCではややCore i7-3770Kが有利と言ったところ。先の考え方からすると、内蔵グラフィックを利用しているケースでは、実質的なTurbo Boostの状態がCore i7-2700KとCore i7-3770Kでほぼ同等であり、そうなるとコアのIPC改善などの効果でCore i7-3770Kの性能が高くなる、という考え方で良いのではないかと判断できる。

グラフ121と122はVideo Renderingのテスト結果である。実はSandraの場合、他にGPGPUのテストもあるのだが、Core i7-2700KはもとよりCore i7-3770Kもエラーでテストが通らなかった。一応OpenCLには準拠だった筈だが、今回利用したドライバはまだ対応が十分ではなかったようだ。そんなわけでGPGPUは省いてDirectX/OpenGLベースでの比較である。

さて、グラフ121がNative Floatでの、グラフ122がEmulated Doubleでの結果であるが、見ての通りどちらも綺麗にダブルスコアである。GPUに関しては、概ね性能が倍増、という表現はこの結果を見る限り適切と言えよう。

グラフ123はGPUからInternal Memoryにアクセスした際のBandwidthだが、この場合はRing Bus経由でメインメモリを直接アクセスする性能となる。意外にもこちらは大差が無い結果となった。ところが、System to Device/Device to Systemの転送速度(グラフ124)は、これまたダブルスコアになった。もっともこちらの場合でも、やっていることはメモリからGPUコアにデータを送り、そこからメモリに送り返す(System to Device)か、その逆パターン(Device to Memory)なので、概ねグラフ123の半分の性能が期待出来る訳だが、Core i7-3770KはともかくCore i7-2700Kはかなり低い数字でしかない。このあたりも、GMA3000→GMA4000で改良されたポイント、ということになるのだろう。