米Intelは米国時間の3月22日に予告した通り、4月6日にIce Lake-SPこと第3世代Xeon Scalable Processorを公式に発表した。この内容をまとめてお届けしたい。
今回発表されたのはIce Lake-SPであり、FPGAのAgilexやOptane SSD P5800X/Optane Persistent Memory 200シリーズ、Intel SSD D5-P5316、それとIntel Ethernet E810-2CQDA2などは既に発表済みの製品である(Photo02)。ということで、Ice Lake-SPを中心に説明したい。
Photo03が今回の主要な特徴である。最大コア数は40に増加。またSunny Coveコアの採用でIPC(クロックあたりの性能)を20%向上させた。AVX 512周りも大分高速化したようで、これらを利用するアプリケーション(AIも含む)では更に高い性能向上が得られる、としている。
Photo04がもう少し詳細な情報となる。最大メモリ容量は6TB(Optane Persistent Memory利用時)、Memoryそのものは8chに増え、PCI Express Gen4をSocketあたり64レーン利用可能となっている。ちなみに今回のIce Lakeは1ないし2 Socket向けとなっており、4 Socket向け以上はCooper Lakeが担う事になっている(Photo05)。
コアそのもので言えば、AVX-512そのものはSkylake-SPの世代から実装されている訳だが、少しづつ機能が強化されており、それもあって例えば暗号化周りで言えば1.5~5.7倍の高速化が可能になった、とされる(Photo06)。またメモリ周りの帯域強化&Latency削減も実現した(Photo07)としている。DDR4-2933×6→DDR4-3200×8でメモリ帯域そのものが1.5倍近く増えたうえ、LLCも1.25MB/coreから1.5MB/coreに強化されていることに加え、恐らくLLCへの帯域そのものも増えているのではないかと思う。またUPI Linkも6.4GT/sec→9.6GT/secときて、Ice Lake-SPでは11.2GT/secに向上したそうだ。更に割込発生→アプリケーション起動までのLatencyが下がった事も挙げられている(Photo08)。
さて実際の性能であるが、まず第2世代Xeon Scalable(や、それ以前)との比較がこちら(Photo09)。内蔵されているアクセラレータを有効/無効化した際の性能改善率がPhoto10、Cascade Lake世代とのアプリケーションの性能比較がPhoto11、後で説明するOptane MemoryやSSDなどとの組み合わせての性能比がこちら(Photo12)となる。Photo13はNetwork Switchなどを対象としたWorkloadで、Ice Lake-SPの新機能/新命令がどんな具合に効果的か、をCascade Lake-SP比で示したものである。Photo14はHPC Application、Photo15は主にInferenceの性能を、それぞれCascade Lake-SPと比較する形で示している。
これに続いてが第3世代EPYCとの比較である(Photo16,17)。アプリケーション性能は、HPC、クラウド、AIのどの分野でもIce Lake-SPが圧倒的に高速、というのがIntelの主張である(Photo18)。
ちなみに現時点でark.intel.comに登録されている製品は全36SKUである(表1)。
- 最大メモリ容量6TB
- メモリチャネル8ch、ECC対応
- PCI Express Gen4対応、64レーン(4×16)
は全てのモデルで共通となっている。上でも少し触れたが、Xeon Silverの中にはOptane Persistent Memory 200シリーズに対応しないSKUがあり、にも関わらず最大6TBというのは多分間違っていると思うのだが、まぁそれは措いておくとして、殆どが2 Socket対応(1 Socketは3つのみ)となっている。
注目すべきはやはりBase Frequencyが殆ど上げられないでいる事だろうか。一部の例外(例えば8コアのXeon Gold 6334)を除くとBase Frequencyは2GHzそこそこである。またハイエンドの40コア製品のTDPは270Wに達しており、それもあってか水冷専用モデル(Xeon Platinum 8368Q)なども用意されていたりする。このあたり、次の世代(Sapphire Rapids)ではProcessが10nm Enhanced SuperFinになって大分改善されるかもしれないが、10nm世代のIce Lake-SPではやはり動作周波数は低めに抑えられている。AVX-512を性能改善のメインにせざるを得ない、というのは多分このあたりから来ているのだろう。
余談だがそのIce Lake-SPのウェハも公開された(Photo19)。この写真から推定すると、ダイサイズは凡そ19.7mm×32.1mmで632.3平方mmという計算になる。28コアでこれなのだから、ハイエンドの40コア製品はかなり大きなダイになると想像される。これはそのまま価格に影響しているだろう。