Bulldozer世代の8コアCPU「AMD FX」"Zambezi"徹底攻略 - アーキテクチャ解析編

では次にMinimal L2 Latencyの結果(グラフ41～48)であるが、こちらは一転して激しいことになっている。まずMethod 1(グラフ41～44)であるが、Forward/Backward共に結構変化が激しいのは、2コアでL2を共有しているためか、それとも一度FPUのBufferを介する形になるためかは分からない。とにかく、Phenom IIよりは確実にLatencyが増えているし、NOP Countが10あたりまでは一番遅い結果になっている。またRandom/Pseudo-Randomでは明らかに性能が悪化しているのがわかる。Minimal Latencyがこれなんだから、平均のLatencyが増えるのも無理ないところだろう。

もっとひどいのがMethod 2(グラフ45～48)である。最終的にはNOP Countが64の時に64Cycleに収束するのはいずれも同じだが、20cycleあたりまでの暴れ方が著しいのが明確に判る。ここまで暴れるとなると、これはアーキテクチャ的にどうこうとかそういう話ではなく、インプリメントレベルでまだ最適化が十分ではないというのが一番ありそうな話だ。少なくともPhenom IIではまともにアクセスできるのだから、技術的にどうこうという話は考えにくい。しいて言えばL2が共有になっている事も多少は関係しているのかもしれないが、いずれにせよこのあたりは性能を落とす理由のひとつになっていると考えてよさそうに思える。