もう一つ、基本的なアーキテクチャについて確認しておこう。以前Conroeの時にこちらからこちらまで確認した、RightMark Memory Analyzer(RMMA)でのMicroarchitecture分析である。今回はKentsfield vs Yorkfieldという形で、どの程度差があるかを見てみた。

まずグラフ13~17がこちらでテストした、基本的なDecoder Bandwidthでの比較である。NOP命令(グラフ13)はともかく、その他の命令についてはやっぱり露骨にL2のLatencyが効いているようで、128KBから6MB付近までは3.5Bytes/cycle前後といったBandwidhtに終わっている。Kentsfieldが3.7Bytes/cycle前後だから、これはやはり無視しえない性能差と言える。もっともこれが効いてくるのはL1 Miss/L2 Hitの領域であるから、普通にプログラムを実行している段階でこれが何かしら問題になるケースはレアであろう、とは思うが。

ついでCMP命令のデコードも比較してみた。まず通常のCMP命令(グラフ18~グラフ23)であるが、これは以前のConroeの結果とほぼ同じであり、特に違いはなさそうだ。