ベンチマークその2 - CPU性能

次はDH55TCとATI Radeon HD 4350を組み合わせた状態で、

  • Core i5-661を使った場合(i5-661)
  • Core i5-750を使った場合(i5-750)
  • Core i7-870を使った場合(i5-870)

の3パターンについてスコアを取ってみた。

Sandra 2010 Engineer Edition

グラフ30~33が演算性能系のベンチマークとなる。Sandraの場合、基本的には全てのベンチマークがMulti Thread化されているので、このあたりはコアの数が多いほど有利となるわけで、動作周波数の差を考えてもi5-750がi5-661を上回り、更にi7-870がその上を行くという構図は全く変わらない。唯一大きく異なるのは、グラフ33である。Cryptgraphyで、AES256のEncryption/Decryptionが圧倒的に高速となっている。これは言うまでもなくAES-NIにSandraが対応しているからである。AES-NIを使わない場合はどうか? というのはSHA256のHasingの結果に概ね近いもので、つまり専用命令を使うことで10倍高速になる、ということがここで明確に示された事になる。

次にグラフ34と35は、先ほどは示さなかったMulti-Core Efficiencyである。このテストは、特にIntelの場合Hyper-Threadingで実現する仮想2コア同士の通信を行うので、HyperThreadingが有効なi5-661とi7-870では性能が伸び、i5-750では性能が下がるという、いまいち役に立たないベンチマークなのだが、それはともかくとして特にグラフ35を見た場合、L1~L2の範囲ではi5-661とi7-870の形状が相似形をしており、この範囲では大きな差が無いように思える(このベンチもまたMulti Thread対応なので、コアの数に応じてスコアが伸びるから、ほぼ2倍のスコア差となる)。また、L3までの範囲は概ね同程度のBandwidthであり、つまり(グラフ33に出てきたAES-NIを除くと)コアそのものには大きな違いはないように見える。

これはCache & Memory Bandwidth(グラフ36)でも同じに見えるが、16MB以上でのBandwidthを比較すると、

Core i5-661 → 9.29GB/s
Core i5-750 → 11.30GB/s
Core i7-870 → 11.38GB/s

と、案外に差が大きいことがわかる。これはBadnwidthだけではなく、Latencyも同じである(グラフ37・38)。

L2/L3へのアクセスも若干Latencyが増えているようだが、それよりも4MBから先、つまりメモリアクセスに関してはLynnfieldのほぼ倍近いLatencyが掛かっていることがはっきり見て取れる。このLatencyの大きさや帯域の少なさが、Clarkdaleの問題と考えてよさそうだ。