RMMAによる内部解析 - Cache/RAM Bandwidth(グラフ157~159)

TLBも一通り見てみたところで、次にCache/RAMアクセス時のピークBandwidthを確認してみたい。まずRead(グラフ157)では、L1で32Bytes/cycle、L2で24Bytes/cycle、L3で20Bytes/cycleという高い性能を出しており、Core i7-6950XはおろかCore i7-7700Kすらもぶっちぎりである。

またWrite(グラフ158)では、ほぼL3までの帯域全体で16Bytes/cycle近くを維持できており、これはIntel2製品と比べて雲泥の差である。当然Copy(グラフ159)でも、Intelに比べると(L3 Hitの範囲では)十分高速な結果になっている。

以前にこちらで紹介した通り、RYZEN 7 1800XではL3まで32Bytes/cycleの帯域を確保していることが明らかにされているが、これが数字としても示された形だ。もっとも32Bytes/cycleといっても、実際にはオーバーヘッドがあるから、Readに関してはもう少し数字が下がる形になった結果がグラフ157ということだろう。