D-Cache/RAM Bandwidth(グラフ73~75)

では次にD-Cache周りについて確認してみたい。まずはBandwidth。グラフ73がReadであるが、ピークで見ると、

Ivy Bridge Haswell
L1 32 Bytes/cycle 32 Bytes/cycle
L2 18 Bytes/cycle 20 Bytes/cycle
L3 10.7 Bytes/cycle 12.7 Bytes/cycle

ということで、HaswellではIvy Bridgeに比べて若干ながらL2/L3のBandwidthが引き上げられているのがわかる。

ではWrite(グラフ74)は? というと、

Ivy Bridge Haswell
L1 16 Bytes/cycle 16 Bytes/cycle
L2 10.2 Bytes/cycle 10.5 Bytes/cycle
L3 7.2 Bytes/cycle 7.8 Bytes/cycle

といったあたり。ただ特徴的なのは絶対的な値よりも、特にWriteでL1~L3の各Bandwidthが綺麗にフラットなことで、このあたりL2で多少暴れているIvy Bridgeと好対照を成している。結果としてCopy(グラフ75)も、L1の範囲では変わらないがL2/L3では若干の性能改善が実現している。このあたりは純粋に帯域を増やしたということだと思う。

ちなみにこの数字はグラフ14~17と完全にはマッチしない(グラフ14~17はL2/L3がもう少し低め)が、これはDecode側がボトルネックになっているためと思われる。

次ページRMMA 3.8 - Maximum RAM Bandwidth