RightMark Memry Analyzer 3.8

RightMark.org
http://cpu.rightmark.org/

中身に変更があるとなれば、おなじみRightMarkである。とはいえ、まずはMemory周りなので、同梱されるRMMTを使ってみた。グラフ10がRead、グラフ11がWriteである。まずReadに関しては、C-SteppingとD-Steppingにおける明確な性能差をここでは見ることが出来ない。が、Writeに関してはこれが極端な形で示された。1Threadであれば差はなく、スコアはごちゃ混ぜになっているが、2Thread以上になると明確にグラフが2つに分かれている事が判る。絶対的な性能差で言えば、2Threadの時で130MB/sec程度、一番差が大きな3Threadの場合でも280MB/sec程度の差でしかないから、絶対的なThroughputに比べると比率はごくわずか(例えば3Threadの場合でも、3%程度の違いにしかならない)とはいえ、手が入っていることを確認するには十分なスコアだ。

では次にRMMA本体に移ろう。ここからは判りにくいので、920Cと920Dに絞って結果を示している。まずグラフ12と13に、NOPとCMP #6のDecode Throughputを示す。NOPは以前にこちらCMP #6はこちらに示す通りであるが、細かい凹凸はあるものの基本的に違いは見られない。強いて言えばL2/L3の終わりごろ(256KB/8MB)のちょっと前からD-Steppingのみ緩やかに性能が低下する(C-Steppingはそれぞれぎりぎりまで粘る)とか、8MBを超えた先のThroughputが若干異なる(微妙にD-Steppingが上回る)といった傾向は見られるが、これはPipelinそのものというよりもCache/Memoryの特性に引きずられる感じだ。他にもTLBやらI-ROBやらも確認してみたが、基本的には殆ど差が見られなかったので、これらのグラフは割愛する。やはり違いはCache/Memoryに集中するようだ。