RMMAによる内部解析 - I-TLB Size(グラフ112~117)
こちらにも書いたがRYZEN 7 1800Xは3レベルのTLB構造になっている。これがどの程度の性能かということで見てみたい。ちなみにRMMAの情報によればこんな感じ(Photo74)である。
|
Photo74:L2 I-TLBは512 Entriesのはずだが、何故か1024/512 Entriesとなっている。発表の512 EntriesはLPの場合で、SPの場合は倍のエントリサイズになるということだろうか?もっとも今回のテストは64bit環境なので、結果はLPの場合になる |
まずNear Jump, Forward(グラフ112)である。0 Entriesの近傍がちょっとだけ下がっているが、これがL0 TLBと思われる。ただこの際のLatencyはほぼ2.5cycleということで、思ったほどには高速ではなかった。
続く64 EnrtiesのL1 TLBが4cycle程度、512 EntriesのL2 TLBが11cycleほどのLatencyとなっている。ちなみにL2 TLBが11cycleで検索できるのは250Entries弱で、その先はLatencyが増えている。これは検索に時間がかかるためだろうか。
合計で550Entryを超えたあたりでTLB MISSとなり、その先はキャッシュアクセスということでさらにLatencyが増しているが、これはCore i7-6950Xも同じことだ。この傾向はBackward(グラフ113)やRandom(グラフ114)、あるいはFar Jump(グラフ115~117)で一定であり、間違いないように思える。
このあたり、かつてのAMD FX-8150の方がずっと良い特性だったのだが、無理に性能を追求するのではなく、消費電力と性能のバランスを取ったようだ。






