Benchmarkその2: 内蔵グラフィック

次はそれぞれの内蔵グラフィックを使って、GPU性能を比較してゆきたい。ちなみにCore i7-3770Kに内蔵されているIntel HD Graphics 4000は本来DVI出力で最大2560×1600pixelの出力が可能な仕様であるが、ASUSTeK P8Z77V-PROの制限でDVI出力が最大でも1920×1200pixelに制限されている。要するにDVI Dual-Linkに未対応という話なのだが、そういう訳でCore i7-3770Kの方は最大解像度は1920×1080まででテストを打ち切っている。

グラフ中の表記は先ほどと同じく

Ivy Bridge : Core i7-3770K+ASUSTeK P8Z77V-PRO
Haswell : Core i7-4770K+Intel DZ87KLT-75K

となっている。

Sandra 2013 SP3a Engineer Edition(グラフ59~68)

今度はGPUテストを中心にお届けする。まず最初がGPGPUを使ってのマンデンブロ図形の計算(グラフ59)であるが、OpenCL/Compute ShaderのFloat/Doubleのどちらにおいても、Haswellは比較的良好な性能を発揮した。とはいえ、性能倍増というレベルではなく、せいぜいが35%前後というところ。Doubleだと更に差は小さい。

次のCryptography(グラフ60~61)は、Ivy Bridgeの方がエラーでデータが取れなかったのでHaswellのみである。性能の絶対値でいうと、グラフ6・7と比較していただくと判るとおり、SHA1/SHA2はともかくAESのEncryption/DecryptionではCPU側の方が高速なほどで、このあたりはまだ改善の余地がある。またHigh2ではおそらくSHA2-512が動作しなかったほか、OpenCLを使ったベンチマークではGPU系が全滅している。全然動作しなかったIvy Bridgeよりはマシとは言え、このあたりドライバの完成度がまだ低いことを物語っている。完成度が高まれば性能が改善するか? というとこれも微妙ではあるが。

次はFinancial Analysisの結果(グラフ62~63)だが、こちらもHaswellはIvy Bridgeに比べれば性能が改善しているし、グラフ9・10と比較していただくと判るとおりCPUで行なうよりもずっと高速である。何がGPU Cryptgraphyと異なるか、といえば計算に必要とするメモリサイズである。Financial Analysisの方は、少ないデータをぐるぐる回してから次にゆく、という形で実装できるから、計算に必要になるメモリサイズは少なく、うまくGPU内部のL2キャッシュ(やCPU側のLLC)でカバーできるが、Cryptgraphyはとにかくデータを読んでEncryption/Decryptionして書き戻しての繰り返しなので、より膨大なメモリサイズが必要であり、こうなるとUMA方式の内蔵グラフィックは原理的に不利である。またCPUはAES命令を持っているから、AES Encryption/DecryptionはGPUに負けない性能になるが、Financial Analysisのテストだとひたすら繰り返しなので、それほど性能が出しにくい。まぁGPU向きのテストだった、ということもあるだろう。

グラフ64・65はGPU Memory Bandwidthの比較である。グラフ64がOpenCL、グラフ65がCompute Shaderであるが、こちらでは特にHaswellが遅いという傾向は見出しにくいというか、普通に高速である。Internalは、L2キャッシュの容量が少ないし、Memory Accessはどうしても遅くなるから、おおむねこんなところだろうという気がする。

グラフ66~68はGPGPUを離れてDirect Xでの利用。まずグラフ66・67はDirectXを利用してのマンデンブロ図形描画であるが、おおむねHaswellが倍の性能を出している(Doubleだともう少し差が縮まるが)。なぜかIvy BridgeはDirectX 9.3でエラーが出たというあたりも謎だが、それにしても本来だとこの位の性能差があるのに、GPGPUではそれほど差が出ないのは、単にGPGPUのドライバ性能の問題なのか、それとも次のグラフ68が示すようにMemoryないしI/O Bottleneckなのか、はこれだけだと判断つきにくい。

そのMemory Bandwidthがグラフ68。Internalはグラフ64・65と大差ないが、Device to SystemはHaswellが高速なのにSystem to DeviceではIvy Bridgeが高速という、ちょっと謎の結果になった。これがハードウェアによるものか、ドライバの出来具合なのかはここでは判断できない。

次ページBenchmarkその2: 内蔵グラフィック - PCMark Vantage v1.2.0