ROB(グラフ6~9)

次はROB(Re-Order Buffer)。Trinityの結果では、「あまり大きくTurboが効いていないのでは?」と判断して補正を入れなかったのだが、実際はたっぷりTurboが効いていたようだ。

結果を見るとForward(グラフ6)、Backward(グラフ7)、Pseudo Random(グラフ9)では、同一とまでは言わないものの大きな違いはない。強いて言うなら、「少しFX-8350の方がLatencyが少ないかな」という程度。ところがRandom(グラフ8)では明確に差が付いている。もっとも絶対的なLatencyが多いから、改善の比率は平均で5%程度、最大でも8%程である。Latencyの絶対差では平均12cycle、最大でも20cycle程度の改善となっており、これは誤差としてみるにはあまりに違いすぎる。少なくともROBの振る舞いに何らかの改善を加え、これは特にRandom Access時に性能改善が顕著、と見ればよいかと思う。Forward/BackwardでもNOP Countが96あたりまでは微妙にFX-8350の方がLatencyが少なく、これも今回の改善による効果ではないかと思われる。

次ページRMMA - Cache/Memory Bandwidth