ベンチマークその1 - 内蔵グラフィックス性能

まず最初は、Core i5-661にDH55TCを組み合わせた状態で、

  • 内蔵GPUを使った場合(内蔵GPU)
  • EAH4350 SILENT/DI/512MD2を装着してこちらのみを使った場合(ATI)
  • EN9400GT SILENT/HTP/512Mを装着してこちらのみを使った場合(NVIDIA)

の3パターンについてスコアを取ってみた。

Sandra 2010 Engineer Edition

SiSoftware
http://www.sisoftware.co.uk/

Sandraも着々とバージョンアップしており、すでに2010がリリースされている。さて、グラフ1にDhrystone、グラフ2にWhetstone、グラフ3にProcessor Multi-Media、グラフ4にCryptographyの結果を示しているが、ここでは単一CPUなので、性能の絶対値にはあまり意味は無く、内蔵GPUを使うことでメモリ帯域がどの程度圧迫され、それが性能にどう影響するかであるが、結果から言うとここまでの範囲では殆ど影響が無い、という結論になる。やはりSandra程度のサイズのベンチマークだとL3キャッシュの効果もあってか、殆ど性能に影響することはなさそうだ。

では実際のメモリアクセス性能は? ということでグラフ5にCache & Memory Bandwidth、グラフ6・7にCache & Memory Latencyの結果をまとめた。グラフ5はさすがにキャッシュが利いている範囲は差が全く無し。一応16MBから先の数字の平均を取ると、

内蔵GPU → 8.85GB/s
ATI → 9.29GB/s
NVIDIA → 9.26GB/s

となり、一応差があるにはあるが、それほど大きくない。またLatencyも4Mを過ぎるあたりから結構差が目立つようになってきているが、絶対的な差そのものはそれほど大きくない。

もっともこれを持って「メモリコントローラが優秀」と判断すべきかどうかはまだ議論が残るところだ。こちらは、他のCPUとの比較の後で判断したい。

グラフ8・9はGPU性能比較である。意外な事にDirect3D 9.0cでのレンダリング最速はi5-661の内蔵GPUで、GeForce 9400が続き、Radeon HD 4350が一番遅かった。ただちょっと考えるとわかるが、Radeon HD 4350はメモリ幅が64bitで、帯域は6.4GB/secに過ぎない(Photo34参照)。対してGeForce 9400は128bit幅で12.8GB/sec、i5-661は理論上21.3GB/secの帯域を利用できる。ある意味これは順当なスコアと言えそうだ。この数字がグラフ8あるいはグラフ9のInternal Memoryにそのまま反映されるわけだから、これはおかしくないのだろう。むしろ問題にすべきは、SYstem to DeviceやDevice to Systemの性能。本来ならばこれもi5-661の内蔵GPUが最速であってしかるべきなのに、むしろ一番遅いというあたりに引っかかるものを感じる。