前編を掲載してからもうすぐ3カ月になる。昨年末にはTDP 95WのFX-8300が追加されるなど製品ラインナップが変わってしまうまで放置した(いや、色々忙しかったんですが)のは筆者の責任である。

前回の記事はこちら
【特集】Visheraこと「AMD FX-8350」を試す - 前編/パフォーマンス徹底検証編
http://news.mynavi.jp/special/2012/vishera01/

ということで、内部解析編をお届けしたいと思う。実はPiledriverベースの解析は一度、Trinityの時にやっている。ただこの時は借用したTrinityベースのReference機がTurboを無効に出来ないということもあって、大雑把に性能は見れたものの、RMMAにおける数値が変動しまくりであった。今回はきちんとTurboを無効としてデータを取得できたので、Trinityの時と見比べながら改めて確認してみる事とする。

AMD FX-8350

RightMark Memory Analyzer 3.8(グラフ1~85)

cpu.rightmark.org
http://cpu.rightmark.org/products/rmma.shtml

まぁ今回の記事は殆どがRMMAの分析と言っても過言ではないのだが、一応後半で消費電力の詳細も検討しているので。このRMMA、今更Intelと比較しても仕方が無いので、今回はZambeziコアのAMD FX-8150との比較としている。ちなみに動作周波数が異なると、特にMemory Accessの際のLatencyが変わってくる(Memory Access Latencyの時間そのものは一緒であっても、動作周波数が上がると相対的にcycle数が増える)事を勘案し、今回はFX-8150/FX-8350共に、

  • 動作周波数は3.6GHz
  • Turbo Coreは無効

という条件で実施した。

Decode(グラフ1~5)

Trinity記事の当該部分はこちら。Decode段のテスト内容はTrinity記事の方を参照されたい。さて結果である。流石に全テストをやるのも何なので、NOP(グラフ1)、SUB(グラフ2)、CMP #2(グラフ3)、CMP #4(グラフ4)をそれぞれ見てみた。

結果から言うと、L1 Hitの状態におけるDecodeのThroughputはFX-8150とFX-8350で完全に同じであった。ただ64KBを超えてL1 Miss/L2 Missの状態になると、結果が変わってくる。FX-8150ではほぼ3.7Bytes/cycleの帯域なのに対し、FX-8350では5Bytes/cycleという結果になっており、これはInst L1-L2間の帯域をここまで引き上げたと考えることができる。L2 Miss/L3 Hitにおける帯域はFX-8150が1.42Bytes/cycle、FX-8350は1.45Bytes/cycleであり、その差はごく僅かではあるのだが、明確にグラフが分離して見えているあたりは何かしらの改善を施して、その結果として本当に僅かではあるが性能が改善したと見ることが出来る。残念ながらTrinityのテストの際に推定した5.4Bytes/cycleには及ばないが、それでもInst L1-L2の帯域を増強したことは明確に見て取れた。

一方でDecodeそのものは今回は大きな変更は無いようだ。ここで示さなかったその他のDecode Bandwidthの結果を見ても結果は同一で、L1 Hitの場合のThroughputはFX-8150とFX-8350で全く同じであった。

またPrefixed NOP Decode Efficiency(グラフ5)でも、これまた僅か(例えばNOP Countが14の時のケースで言えばFX-8150が0.33Bytes/cycleに対してFX-8350は0.36Bytes/cycle)で、本質的な改善は無い(例えばこちら:の結果におけるA8-3870KのBandwidthと比較するとまだ大差がある)ものの、若干の改善は施されたことが読み取れる。

次ページRMMA - ROB