既報の通り、インテルは4月9日に都内で記者説明会を開催し、第2世代Xeon Scalableプロセッサをはじめとするサーバ向け製品を改めて紹介した。この内容を簡単にお伝えしたい。

まず「改めて」というのは、今回の内容は米国時間の4月2日にIntelが開催した「DATA-CENTRIC INNOVATION DAY」と呼ばれるイベントで発表済みからだ。これを日本メディア向けに説明するというのが趣旨となる。

冒頭で挨拶に立った鈴木国正社長(Photo01)は、2022年までのデータ通信量の増加予測を示しながら、日本もまだ伸びる可能性が十分で(Photo02)、大容量のデータ処理や通信といった用途に対して、今回発表された製品群が効果的であるとした。

  • Photo01:おなじみインテル(株)代表取締役社長の鈴木国正氏

  • Photo02:数字はCiscoのものだが、日本が世界平均よりやや多い点について、ここ数年、国内ではあまり投資が活発ではなく、やや世界に後れを取っているため、ここで追いつこうとする動きなのではないか? と説明する

ディープラーニングで前世代比28倍

続いて米国本社より来日したJason L. Grebe氏が各製品の詳細を紹介した。まずは第2世代Xeon Scalableプロセッサである(Photo04)。これはCascade Lakeという名前で開発されていた製品で、基本的には先代のSkylake-SPと同じく14nm++プロセスで製造される。

  • Photo03:Corporate Vice President, General Manager, Cloud Platforms and Technology GroupのJason L. Grebe氏

  • Photo04:Cascade Lakeの主な特徴。標準製品だけで50以上(Intel ARKによると58製品)が用意される

前世代との違いとしては次の3つが主に挙げられる。

  • Spectre Variant 2/3/3a/4及びL1TFに対応した脆弱性対応がハードウェアの形で実装された
  • Intel DL Boostを搭載
  • Intel Optane DC Persistent Memoryに対応

このうち、最初の脆弱性対応は良いとして、続くIntel DL Boostだが、これはAVX512のNeural Network拡張であるAVX512_VNNI(Vector Neural Network Instruction)を指す

AVX512_VNNIは、これまでKnight MillベースのXeon Phiでのみのサポートだったが、Cascade LakeでXeon Scalableとして正式に対応した形だ。

3つ目のOptane DC Persistent Memoryへの対応は、従来から説明されていたことで、これにより最大512GBのDIMMを利用できるようになる。したがって、理論上は、ソケットあたり最大4.5TBのメモリ空間を実現する。

このCascade LakeをMCM構造で2ダイ搭載したものが、2018年に予告されていたCascade Lake AP(Advanced Performance)で、これも今回Xeon Platinum 9200シリーズとして発表された(Photo05)。

  • Photo05:当然パッケージは従来モデルと互換性なし

コア数は合計で56コア、1ソケットあたり112スレッドとなる。ただしCascade Lakeは、8ソケットまでの対応なのだが、Cascade Lake APでは2ソケットまでという制約がある。

パッケージも倍とは言わないまでも、かなり大型化している(Photo06~07)。ちなみにCascade Lakeのパッケージサイズは、76.0mm×56.5mmとされているので、恐らくCascade Lake APは76.0mm×76.0mmと想像できる。

  • Photo06:左は後述するXeon D-1600シリーズ。中央がCascade Lake、右がCascade Lake AP

  • Photo07:裏面はこんな感じ。Cascade Lake APでは、Ball Pitchが0.99mmだそうである

性能に関しては、Deep Learning関連(CafeeでResnet-50を利用)の場合、Xeon Platinum 8100比で、Xeon Platinum 8200が14倍、Xeon Platinum 9200が28倍の向上を実現したという(Photo08)。さらにNFVなどのネットワーク利用時に最大1.76倍のワークロードパフォーマンスを達成したとしている(Photo09)。

  • Photo08:これはDL BoostというかAVX512_VNNIが8bitデータの取り扱いが可能なため、効率的にResNet-50を処理できるためである

  • Photo09:これはIntel DPDKを利用してのNFVの処理性能の比較となる

Cascade LakeとCascade Lake APのスペックを表1(すでに出荷開始した製品)と表2(今後出荷予定の製品)にまとめた。なお、出荷予定の製品も2019年第2四半期に出荷を開始するとのことで、遠からず追加されるものと思われる。

  • 表1:すでに出荷開始した製品(クリックで拡大します)

  • Photo09:表2:発売予定の製品(クリックで拡大します)

Optane DC Persistent MemoryはIn-Memoryで効果が著しい

CPUに続いてはメモリとストレージ周りが説明された。Optane DC Persistent Memoryは前述の通り、DIMMあたり最大512GBという大容量をサポートできる。そのため、特にIn-Memory Applicationでの性能向上が著しいという(Photo10)。

  • Photo10:DC Persistent Memoryの場合は不揮発性のため、電源投入→再ロードの必要がなく、redisにおけるms未満のSLA達成に効果的だったとのこと

容量としては128GB/256GB/512GBの3種類が用意され、すでに出荷が始まっている。ただし、OEM経由での供給となるためか、推奨小売価格は未公表である。

またOptane SSD DC D4800XとSSD D5-P4326もやはり発表された(Photo11)。Optane SSD DC D4800Xの方は、2017年11月に出荷したOptane SSD DC P4800Xのデュアルポート版で、1ポートが故障してももう片方のポートで処理を継続できるというもの。

  • Photo11:I/FはNVMe 3.1×4

ミッションクリティカル向けに、ストレージコントローラを冗長化するといった用途向けの製品である。こちらのラインナップや推奨小売価格、出荷開始時期などは後日アナウンスされる予定となっている。

一方のSSD D5-P4326はRuler SSD(物差しSSD)の名前で知られるエンタープライズ向けストレージである(Photo12)。実際にはこのRuler(Form E1.L)のほかに15mm厚のU.2モデルも用意される

  • Photo12:そのRulerを示すGrebe氏

構成はQLC 3DNANDで、現時点では15.36TBのものが出荷されているが、最大容量は32TBとされており、E1.Lを利用すると1Uラックで最大1PBの容量が実現するという。

ネットワーク向け製品も多数ラインナップ

次がEdge向けソリューションだが(Photo13)、FPGAのAgilexはレポート済みなので今回は割愛させていただき、Xeon D-1600シリーズ(Photo14)について。

  • Photo13:Ethernetは別にEdge向けというわけではない気がする

  • Photo14:こちらもOEM向けとあって推奨小売価格などは発表されていない

開発コード名はHewitt Lakeで、構成そのものは同社が2016年に発表したXeon D-1500シリーズの延長にある。

ただD-1500系列が定格1.3GHz~2.4GHz、最大でも2.7GHz程度の動作周波数に留まっていたのに対し、D-1600系列では定格で2.4GHz~2.8GHz、最大で3.2GHz程度まで動作周波数を引き上げた。

その代わりコア数は最大でも8(Xeon D-1577は16コアだった)となっている。これにQuick Assit Technologyなどの搭載で、従来比で30%程度の性能が改善されたと説明する。

最後がIntel Ethernet 800シリーズ(Photo15)で、Columbiavilleという開発コード名の製品である。同社がこれまで出荷してきた10/25/40Gbps Ethernetである700シリーズことFortvilleの後継にあたり、最大100Gbpsに対応する。

  • Photo15:ちなみに現時点でColumbiavilleで検索すると、コード名はあるのにページがない

従来のFortvilleに搭載されていたIntel AVF(Virtual Function Driver)に加え、新たにADQ(Application Device Queues)と呼ばれる機能が追加された。このEthenet 800シリーズは現在はサンプル出荷中で、量産開始は2019年第3四半期を予定する。ラインナップ詳細及び価格などは、現時点では未公表である。

気になるのは消費電力だ。パッケージ(Photo16)は(基板裏面の配線を見る限り)ワンチップ構成で、ヒートシンクにアクティブファンなどはない、比較的簡単なアルミ製なので、Fortvilleと同じく7W程度で収まるものとみられる。

  • Photo16:Ethernet 800シリーズカードを示すGrebe氏