Minimal RAM Latency(グラフ79~94)

今度はMemory AccessのLatencyを、Blockと32MB Blockの場合で測定したものだ。このテストではやはりLatencyが多くなる関係で、Turboの効きは悪いだろうと判断し、補正グラフは入れていない。まず8MBに対してL1のCache Lineでアクセスした場合がグラフ79~82である。とにかく目を引くのがA8-3870Kの暴れっぷりであるが、これはひょっとすると内蔵GPUからのリフレッシュ割り込みが効いているのかもしれない。ではA10-4600Mは? というと、暴れてはいないのだが、全般的にFX-4100よりやや多いLatencyとなっている。特にRandom/Pseudo-Randomでは倍以上のLatencyとなっているあたりが、メモリコントローラ周りに何かあることを物語っている。確認には、内蔵GPUを無効にして外部GPUを接続してテストしてみればいいのだが、今回の評価機では実行不可能なので、これはいずれデスクトップ向けが出荷されたタイミングで、という事になろう。ただFX-4100のLatencyが低いのは、大容量L3に助けられたところもあるようで、32MBでのテスト(グラフ83~86)ではもっと悪化しているのがわかる。

さて、ではL2は? というとこちらではなぜか急激にA10-4600MのLatencyが増えているが、これも同じ理由と考えられる。FX-4100ではL3がある程度Prefetchを含めてLatencyを吸収してくれるが、A10-4600Mではこのバッファがない分、いきなりMemory Accessになる分Latencyが増えると思われる。実際グラフ87~90ではA10-4600MのLatencyが目立って大きいが、32MBのグラフ91~94ではFX-4100もLatencyが増えており、それほど大きな差になっていないからだ。

ただそうなるとむしろ疑問なのは、なぜ同じようにL2が1MB/CoreしかないA8-3780KがここまでLatencyが増えていないか、である。根本的にアーキテクチャが違うから、というのはあまり答えになっていないのだが、結果が明確に出ている以上何かしらあるのは間違いなさそうだ(といっても、残念ながら「なぜ」の仮説もちょっと思いつかないのだが)。