RMMAによる内部解析 - I-TLB Assosiativity(グラフ118~141)

Sizeの確認のついでに、Associativityについても見てみた。まずグラフ118~129がNear Jumpの結果である。概して16 Entries(グラフ118~120)、32 Entries(グラフ121~123)、64 Entries(グラフ124~126)の結果はほぼ5cycle前後で安定している。強いて言えば64 Entriesの結果はややLatencyが多めだが、これは検索に時間を要しているためだろう。

ところが128 Entries(グラフ127~129)になると極端にLatencyが増え、しかもその値が激しく変動している。最初の4 Segmentあたりまでの検索が10cyclesそこそこだから、ちょっとその後の荒れ方が凄い感じだが、とりあえず64 Entriesあたりまでは結構高速にアクセスできることは確認されたと思う。

同様にグラフ130~141がFar Jumpであるが、こちらも傾向は同じである。16~64 Entries(グラフ130~138)はほぼ一定の傾向なのに、128 Entries(グラフ139~141)だと途端に暴れまくることになる。

なんというかここまでRYZEN 7 1800Xを見ていて「当たるとスマートだけど、外れると大きく性能を落とす」傾向が随所に見られることに気が付く。おそらく性能と消費電力というかメカニズムの複雑さのバランスを取ったためとは思うが、このあたりが仕組み的にはCore i7-7700Kに負けないIPCを得られる構造を実装しつつ、実際にはちょいIPCが低い理由の1つではないかと感じた。