Sandra 2015 SP2b Engineer Edition その2(グラフ15~27)

SiSoftware
http://www.sisoftware.co.uk/

次はRMMAを使って細かくチェック……したいところだが、その前にSandraを使って、内蔵GPUに関する性能比較も行っておきたい。まずグラフ15と16は、GP Processingである。

Single/Half-Floatに関してはGodavariの圧勝という構図は面白い。もっともDouble/Quad-Floatになると相対的にBroadwellの性能が伸びており、スコアを見ていると、潜在的にIntelのGPUコアは、それなりの性能があるのが、メモリ帯域に足を引っ張られているという感じもする。

肝心のSkylakeは、ほぼHaswellとBroadwellの中間というあたりに位置する。BroadwellからL4キャッシュを抜くとこの程度に落ちるということかもしれない。

グラフ17~19はCryptographuである。AESのEncode/Decodeに関しては、Godavariが圧勝で、Broadwellが続く。SkylakeはBroadwellとHaswellの中間あたり。

これがHasing(グラフ19)になるといきなりBroadwellが大きな伸びを見せるが、これはL4がうまく機能しているということだろうか? もっともGodavariも踏ん張っており、Skylakeを上回るスコアを出しているのはコストを考えると称賛ものではあるとは思う。

グラフ20~22はFinancial Analysisである。いずれのテストもCompute ShaderはDoubleだとエラーでテストできず。さらにIntel系はOpenCLでもDoubleはエラーになり、ややグラフがさびしくなっている。結果は見て通りで、最高速はGodavari、ついでBroadwellが来て、SkylakeはBroadwellとHaswellの間ということになる。

グラフ23~25はScientific Analysisの結果で、こちらもFinancial Analysisと状況には同じだが、グラフ23の様にSkylakeがHaswellを下回る結果を示したケースがあるのは、純粋にドライバ側の熟成不足な様にも思える。

グラフ24のFFTでBroadwellが伸びているのはFFTに付き物の転置が高速に行えるからで、逆にGodavariには相対的につらいテストである。それでもSkylakeより高速なのはなかなかに思える。

グラフ26と27は、前項のグラフ13と14をGPU側から行ってみたものである。まずInterface(グラフ26)を見るとOpenCLとComputeShaderで随分スコアが違うのが気になるが、傾向的にはBroadwellが高速で、これにGodavariとSkylakeが続く傾向となっている。Skylakeがもう少し伸びても良さそうな気はするが、逆にGodavariが予想以上に健闘しているというべきかもしれない。

一方のInterface(グラフ27)は、項目よって値の変動がかなり大きいのだが、Compute ShaderのSystem to Deviceを除くと、SkylakeよりもHaswellの方が高速となっている。アーキテクチャの問題なのかドライバの熟成の問題なのか、にわかには判断しにくい。怪しいのはドライバの方ではあるが、それを断言できるだけの材料も無い、というのがここでの結論である。