パフォーマンス - 従来製品や競合製品との比較を紹介

最後にパフォーマンスについてご紹介する。以下のデータは、まだ製品スペックの前段階である試作品をベースとしたものでの結果であり、実際の製品とはやや異なることにご注意いただきたい(Photo24)。

Photo24:Xeon D-1520は製品と同一スペックだが、D-1540の方は1bin(100MHz)低い数字になっている

まずテスト環境だが、Atom C2750を利用したSuperMicroのSuperServer、Xeon D-1540ベースの試作品、HPのMoonshotのAtom C2750版およびAPMのX-Geneベースのものの4種類である。

Photo25:Xeon D-1540のみFedora 20/RedHat 7 ELでほかがUbuntuだが、いずれもカーネルは3.10以降なのでここで極端に違うということはないだろう。またC2750ベースのMoonshot以外は10GbE×2をDiscreteカードの形で搭載している。IntelのX552というのは、10GbEポートに10GBASE-TのPHYを繋いだ意味なのか、それともPCIe Gen3レーンに直接接続する形で10GBASE-TのMAC/PHY統合製品を接続した意味なのかは判明していない

まずはAtom C2750とXeon Dの試作品との比較(Photo26)で、Stream/SPECintといったCPU性能、Memcached/Static Web Serving/Dynaamic Web Serving/Server Side JavaなどのWeb関連、Storage Transaction、Networkingなどの性能を比べたもの、Static Web ServingはNGINXを利用し、CPU負荷率100%までかけたときにどれだけのページをServeできるか、Dynamic Web Servingは同じくNGINXを利用し、ページアクセスのトランザクションが95% SLAで2~3ms以内を確保する場合に何ユーザーが利用できるかを比較しているという具合に、割と現実的なシナリオでテストは行われている。

Photo26:Networkingのみ、D-1540ではなくD-1520を利用しての結果とのこと

このテスト結果を基に絶対性能とPower Efficiencyを比較したのがPhoto27。試作品のXeon Dで1.3倍程度であり、製品版ではもう少し性能が上がる分、最大1.74倍程度まで効率が改善する、という見積もりとなっている。

Photo27:Dynamic Web Servingを例に取ったのはPhoto26でこれが一番スコアが大きかったからであろうと思われる。そういう意味では、Power Efficiencyの方は平均するともう少し下回るかもしれない

またSPECintratebase2006の結果をベースに、AtomおよびXeon Eのv3シリーズと比較したのがこちら(Photo28)である。Xeon E3-1200 v3の場合はいずれも4core構成で、ハイエンドのE3-1281 v3とかE3-1286 v3でも定格3.7GHz程度であり、これに対してXeon D-1540は定格こそ2GHzながら8core構成なので、アプリケーション性能はともかく純粋に動作周波数×コア数を比較するとこれを上回る数字になる計算だ。

Photo28:それはともかく、ここでXeon E5シリーズなら更に最大5.1倍の性能を、と主張する意味がよく判らない。それだけスケーラビリティがあると言いたいのだろうか?

もちろん、このあたりはXeon Eシリーズが14nm世代のBroadwellベースになるとまた関係が変わるとは思うが、Atom Cシリーズに比べて随分性能の底上げがなされているのがわかると思う。

次は仮想的というか、Intelにとって大きな競合相手であるARMサーバーとの比較である。とは言え市場に製品レベルで出荷されているのは目下のところAPMのX-Geneしかないので、これとの競争である。

まずPhoto29はStream/Web系テストの結果だが、直接的にX-GeneとD-1540を比較できなかったためか、ここでは同じ筐体を利用するC2750ベースのm300を利用してのテストとなっている。

Photo29:下の注意書きにあるように、それぞれ特異な問題があった結果、いくつかのテストではAtom C2750のスコアが低く、一方memcachedではAtom C2750が妙に突出しているという話。ただ根本的にTSMCの40nmで製造されているX-GeneとAtom C2750の比較がちょっと無茶な気がする

いくつかのテストでは妙な結果がでているが、おおむねAtom C2750の方が良好というのがここでの結果であり、さらに性能/消費電力比とか性能/価格比を示したのがPhoto30となる。

Photo30:消費電力に関しては、X-Geneの側はMellanox Connect-X3 Dual 10GbE NICを搭載している分を加味しないといけないので、これが公平な比較かどうかはちょっと微妙なところ。ただHPがX-Gene用にGbEカードのオプションを出していないので仕方が無いといえば仕方が無いのだが

ただ、そもそもX-GeneはソフトウェアをARM v8-Aにポーティングするためのプラットフォームという位置付けにあるからそもそも価格は高めだし、プロセスもTSMCの40nmを使ったものだから、Atom C2750とかXeon D-1500と直接比較する位置づけにあるかどうか微妙なところ。実際にはまもなく市場に出てくるであろう、Cortex-A57を搭載したサーバーチップと比較すべきな気はちょっとする。

まぁそうは言っても「現状市場に出ている製品」というくくりで比較した場合、Atom C2750は64bit ARMプロセッサよりも良いソリューションであり、Xeon D-1500はさらに良くなる(Photo31)というメッセージになるのは、Intelの立場からすれば当然か。

Photo31:こちらはSingle Thread Performance。こうなるとコア数は関係ないので、E3-1280との性能比は周波数に比例して1.4倍となる。それより面白いのはC2750との比較で、2.4GHzのSilvermontより1.9GHzのBroadwellが2.48倍高速ということで、同一周波数で比較するとBroadwellはSilvermontの3.13倍ほど高速、という計算が成立する。もっともこのテストはTurbo Onなので、実際には数字はもう少し変わるかもしれない

ということで、簡単にXeon Dファミリーをご紹介した。ちなみにIntelによれば、2015年3月に発表されるのはこの2製品のみで、後追いの形でさらに製品は追加されるとの事である。

ただ筆者がちょっと気になったのは「なんでこの製品の発表をこんなに急いだのか」ということである。理由はなんとなくわかっていて、Broadwell-E系列のXeonがまだ当分リリースできないので、つなぎとなる製品が必要だったのだろう。

現在のIntelのプロセスだと、TDPが13WのXeon E3-1220L v3や25WのE3-1230L v3/E3-1240L v3の後継はすぐにBroadwellベースでリリースできるだろう。ただ、45WのE3-1275L v3はちょっと難しいだろうし、65WのE3-1285L v3/E3-1286L v3はかなり困難と思われる。そして大多数を占めるTDP 80/84W製品の代替はP1273を待たねばならない。

Low Powerのみv4にする、というのはいくらなんでも無茶であり、そこでこうしたLow Power Xeon E3の代替にあたる製品のみ先行する形でXeon Dとして切り出したのだと予想できる。

この結果としてXeon E3のv4ではL付きとなる省電力製品がどのくらい出るのか、ちょっと微妙な感じになってきた。おそらくこうした省電力品はSoCに移行させ、既存のXeonは65W以降に絞る、という形になるのではないかと筆者は想像する。