◆IntelBurnTest V2.544(グラフ9)
AgentGOD
http://www.xgamingstudio.com
さて、同じくコア数が性能に直結しそうなLinpackは? ということでIntelBurnTestであるが、意外にも性能が最大になるのはMaximumの場合のみで、Standard(1GB)~Very High(4GB)程度だと、Ryzen Threadripper 3960Xにも劣る程度の性能しか出ない、というちょっと面白い結果になった。
ただこれの理由は明確で、メモリ不足(正確にはメモリ帯域不足)である。メモリが少ないケースでは、L3がそれほど効果的に作用しないから煩雑にメモリアクセスが発生する。ところがRyzen Threadripper 3990Xではコア数が倍だから、アクセス頻度も倍になる訳で、メモリバスの奪い合いになる訳で、これがオーバーヘッドになって性能が落ちる訳だ。Maximumだとメモリを最大限に使う=行列のサイズが大きいから、計算頻度に比べてメモリアクセスの頻度が減る事になり、相対的にメモリバスの帯域のボトルネックが減る、と言う訳だ。ただMaximumにしても、Ryzen Threadripper 3970Xを僅かに超える程度の性能に過ぎない訳で、依然としてメモリ帯域が不足している事に変わりはない。こうした類のワークロードでは、メモリが8chのEPYCを使うべき、ということだろう。
◆SPECviewperf 13(グラフ10・11)
SPEC
https://www.spec.org/benchmarks.html
まぁこちらは予想通りで、基本的にはOpenGLの性能という感じになるからそれほど性能差はないだろうと想像しており、その通りの結果になった。相対性能で見ても、確いくつかの項目で最高速とはいえ、大きな差とは言い難い。概ね、Ryzen Threadripper 3970Xと同等といったところか。
◆SPECworkstation 3.0.2(グラフ12~17)
SPEC
https://www.spec.org/benchmarks.html
さてSPECWorkstationだが、これが意外というか予想通りというか、かなりスコアがばらつく事になった。まずOverall(グラフ12)で見ると、Product DevelopmentとかLife Scienceでは妙にスコアが低い。その一方でEnergyでは最高速といった具合に、テストによって性能が上がるもの上がらないものがはっきり分かれる感じだ。
まずMedia and Entertainment(グラフ13)。Blenderとかではちょっとだけ性能があがるが、あとはRyzen Threadripper 3970X並といったところで、性能差があるとは言い難い。
Product Development(グラフ14)では、CalculiXでは妙に性能が低いし、rodiniaCFDもあまり高い性能とは言い難い。もっと極端なのがLife Sciences(グラフ15)で、namdが圧倒的に遅い。namdは複数のテストから構成されているが、実データを見てみると
テスト項目 | 基準値 | TR3970X | TR3990X |
---|---|---|---|
apoa1 | 90.25 | 10.06 | 125.02 |
flatpase | 279.022 | 30.24 | 405.16 |
stmv | 959.01 | 101.42 | 647.34 |
となっており(いずれも所要時間。単位:秒)、すべてのテストが猛烈に遅くなっているのは間違いない。ログを見ても、何が原因で、という話は不明だが、何らかの最適化が必要になっており、ただそれをSPECWorkstationが正しくハンドリング出来ていない様に思われる。ただその一方でrodiniaLifeSciの様に最高速を記録するベンチ結果もあるため、一概にRyzen Threadripper 3990Xが期待外れとも言い難いのだが。
Energy(グラフ16)で突出しているのがFFTWの性能の高さ。FFTWの場合、行列の転置とか要素の並べ替えなど、キャッシュにヒットする範囲で猛烈なメモリアクセス(というかキャッシュアクセス)は発生するものの、結果を書き戻して次の処理を行う(=外部のメモリアクセスを行う)頻度はそれほど高くなく、ひたすら計算能力が要求されるタイプの作業であり、まさしくRyzen Threadripper 3990Xに適した処理である。Ryzen Threadripper 3970Xの倍とは言わないものの6割近い高速化を果たしているのは、動作周波数の差を考えれば納得の性能である。ほかのテストはここまで差はないものの、相応に高い性能を示している。
General Operations(グラフ17)はまぁそれほどの差はないと思われ、実際結果もそうした推定を裏付けるものになっている。