• COMPUTEX TAIPEI 2024の開幕基調講演に登壇したIntelのCEO、Pat Gelsinger氏。「Lunar Lake」「Xeon 6」「Gaudi 3」という、このAI勃興の時にどれも要となる次期製品を発表

Intelは6月4日、次期Coreプロセッサ「Lunar Lake」、データタセンター向けプロセッサ「Xeon 6」、AIアクセラレーター「Gaudi 3」の詳細な情報を公開した。これら製品で包括的にAI PCのリーダーシップを狙うとしている。台湾・台北市で開幕したCOMPUTEX TAIPEI 2024の基調講演にて、米IntelのPat Gelsinger CEOが発表した。

まず、今回のGelsinger CEOによる主な発表内容は以下の通り。

  • Lunar Lake アーキテクチャ、CPU・GPU・NPUの詳細を開示
  • Xeon 6はCPUコアが異なる「Xeon 6 P」と「Xeon 6 E」の2系統へ
  • Gaudi 3は性能を引き上げつつ、価格でもNVIDIA対抗を強く意識

関連して現地では、それぞれの特にスペックやテクノロジーの内容をさらに掘り下げる個別セッションも実施されており、それらの内容は別途、すぐに追加レポート記事としてお届けするので、あわせて参照いただきたい。

  • 画像はASUSの新型Zenbookに搭載されるLunar Lakeのマザーボードを撮影したもの。台湾の1元コインと並べてみた。パッケージのサイズは実寸で縦横が約27mm

    写真はASUSの新型Zenbookに搭載されるLunar Lakeのマザーボードを撮影したもの。台湾の1元コインと並べてみた。パッケージのサイズは実寸で縦横が約27mm

  • これは絵。Lunar LakeのSoCパッケージのイメージ

Lunar Lake - NPUとGPUも世代交代、CPUはHT削除しIPC向上を重視

Lunar Lake(開発コード名)は、省電力で薄型軽量なノートPC、主に「AI PC」向けの次期Coreプロセッサで、従来のMeteor Lake「U」を置き換える。ゲームやAI性能が大きく向上しながらも、搭載ノートPCのバッテリ寿命は最大60%伸びるのだという。AI PCということで、目下、Snapdragon X Plusなどが直接の競合になってくる。

既報の通り、製品のリリース時期は今年2024年の第3四半期。AI処理の性能はTOPS(Tera Operations Per Second)の単位だと、CPU・GPU・NPUを合算したチップ全体で最大120 TOPS、NPU単体でもMicrosoftの「Copilot+ PC」の基準を満たす45 TOPS以上(最大48 TOPS)となっている。

  • Lunar LakeのAI性能の内訳

なお、Lunar Lakeのチップ製造には、台湾の半導体受託製造企業であるTSMCの先端プロセスを使うという予測がでていたが、今回改めて公になったのは、CPU・GPU・NPUを含むコンピュートタイルがTSMCの「N3B」、I/O類が置かれたコントローラータイルがTSMCの「N6」で、これをIntelの3次元実装技術のFoverosを使って、ベースタイル(Intel P1227.1で、Meteor Lakeと同じ)に積層している。

  • Compute tileはTSMCのN3Bを使って製造。N3BはAppleがA17 BionicやM3用に買い占めたというウワサもあったが、Lunar Lakeもこれが使えたようだ

SoCパッケージの基板上には上記のタイルのほか、メインメモリチップとして転送速度8.5GbpsのLPDDR5Xを2チップ、合計最大32GBの容量で実装している。メモリをオンパッケージとしたことは、省スペースと省電力にも寄与する。なお、COMPUTEX会場で確認できたLunar Lakeの実機サンプルには、サムスン製のLPDDR5X「K3KL3L30DM」のES品が搭載されていた。なお、Lunar Lakeにはメモリ容量が16GBのSKUも用意される。その際にメモリチップ数が変わるのか、であれば接続チャンネル数や帯域はどうなるのかなどは、取材時点では非公開扱いであった。追ってSKU情報が出てくれば判明するだろう。

  • Lunar Lakeにメモリ16GB版があることは確認できたが、どういった形で載るのかはまだ聞けなかった

  • これは冒頭のZenbookのマザーボードと同じもの。メモリをオンパッケージとしたことで、ボード面積を節約できるという効果もある

  • ちなみにメモリはサムスン製のLPDDR5XのES品が載っていた

  • これがLunar Lake搭載の新型Zenbook。たぶんComputex期間中に製品発表があるだろう。薄いだけでなく天板が新素材だったりしてかなり綺麗なモバイルノートPCだった

  • Lunar Lake搭載PCのデモは、AIはもちろんだが、従来のPCとしても本体の薄さ軽さや、電力比性能をアピールするものも多い。画像のシチュエーションでは、Meteor Lakeと同じ処理をさせているときの消費電力をリアルタイムで比べている

CPUはP-core(Performance-core)に「Lion Cove」コア、E-core(Efficient-core)に「Skymont」コアのハイブリッド構成。Pコアが4基、Eコアが4基の計8コアだ。トピックとしては、今回のPコアからはHyper-Threadingがついに省かれた。Eコアとセットでスレッドのスケジューリングを空きなく最適化しているLion Coveに対し、HTを有効化すると使う電力や実装面積でかえって効率が悪くなるから、ということらしい。HTは電気的に無効化というわけでもなく、物理的に載っていない。

  • Compute tile部分のブロック図。IPUはカメラ処理用で、ノイズ除去等やHDRなどのカメラ機能を少ない電力で処理できる。メディアエンジンのところにはAV1エンコーダ・デコーダ、VVCデコーダが入った

  • Lion CoveとRedwood Cave(Meteor Lake)のIPC比較

  • 性能に対する電力や実装面積の効率で、Hyper-Threadingが外れた

GPUはXe GPUの第2世代である「Xe2」を搭載している。これの開発コードネームは「Battlemage」だそうで、とりあえずAlchemistの次がちゃんと出てきたのはディスクリート派にも一安心かもしれない。Lunar LakeのXe2は、グラフィックス用のXe2 GPUコアとAI用のXMX(Xe Matrix Extension)からなり、GPUコアの性能は現行Xe比で1.5倍、XMXは最大67 TOPSの性能を持つとされた。

  • Lunar Lakeの「Xe2」。新設計のXeコアが8基

  • 前世代との性能比較

  • Lunar Lakeながら、「F1 24」がHD(にしか見えない)画質でヌルヌル動いているというデモを見せてもらった。薄型ノートPCの内蔵GPUでこれができる理由は、480Pで出力して、XeSSでアップスケーリングしているから。なるほど実用的

NPU(ニューラル・プロセッシング・ユニット)は、まずAI性能が48 TOPSと、Meteor Lakeの11.5 TOPS程度から実に4倍増。単純に、NPUの実装規模も3倍増しており、その時点でAI 性能をかなり重視していることがわかるが、世代してもMeteor Lakeに載っていたNPU 3720を「NPU 3」としたのに対し、Lunar LakeのNPUは「NPU 4」を名乗っていて、効率改善など内部に手が入っている。

  • NPUの性能は4倍に。NCE(Neural Compute Engine)がそもそも2基から6基に3倍増

  • Stable Diffusionで性能を比較したグラフ。絶対性能はもちろん段違いだが、電力効率もかなり良くなっているようだ

  • Controller Tile部分のブロック図。Thunderbolt 4やWi-Fi 7、PCIe Gen5を搭載

  • あとはCompute tileの方にメモリーサイドキャッシュというキャッシュが載っていて、メモリアクセスの帯域幅の節約や、省エネに役立つという説明。GPUがメインメモリを使うときの速度不足を補うバッファっぽいが、詳細が不明なので、追って調べてみたい

Lunar Lakeでは総じて、AI PCとしての性能向上と、前世代のMeteor Lakeと比較して(メモリ含むSoCで)最大40%の消費電力を削減したという省電力性を推している。

Gelsinger CEOはLunar Lakeについてx86の互換性の優位も説明しており、「AIを民主化する」として、オープンスタンダードであることに利点が存在することと、これまでに築かれた強力なエコシステムによってAIを推進する機会が得やすいこともアピールしている。

AI PCではクアルコムやAMDなどが競合として活発に動き始めたことを意識してか、Gelsinger CEOは、「他社もAI PC市場へ参入を"準備"しているが、Intelは既に(Core Ultraなどによる)AI PCを大規模に展開している。Lunar Lakeは計画通り年末商戦に間に合わせる。20以上のメーカーが80機種以上のLunar Lake搭載AI PCを計画しており、今年全体では、4,000万個以上のCore Ultra搭載PCが出荷されることになる」と説明。同社が先行して業界の主導権を握るつもりであることを強調している。

  • NPUを積んだCore Ultraを既に大規模展開しているし、NPU性能が大きく上がったLunar Lakeも大量の製品がすぐに出てくるという説明

  • Pat Gelsinger CEOは講演で、Lunar Lakeを搭載した「AI PC」を並べて、AIを「Centrino」以来の動きだと強調

Xeon 6 - PコアのみのXeon 6 with Pと、EコアのみのXeon 6 with E

続いて、6th Gen Xeon Scalableとはならず、製品ブランドの命名法則を一新して「Xeon 6」となったデータセンター、ネットワーキング、エッジ向けのXeonの次期製品について。

  • 「Xeon 6」は、ダイの形状がモデルによってかなり異なる

今回、Xeon 6700シリーズとXeon 6900シリーズの2グレードが発表され、それぞれにPコアのみの「Xeon 6 P」(開発コード名:Granite Rapids)と、Eコアのみの「Xeon 6 E」(開発コード名:Sierra Forest)をラインナップすることが発表された。なお、Xeon 6 EのXeon 6700シリーズ「Xeon 6700Eシリーズ」については本日より発売となる。Xeon 6 Pは今年の第3四半期より発売することも発表された。

  • Pコアのみの「Xeon 6 P」(開発コード名:Granite Rapids)と、Eコアのみの「Xeon 6 E」(開発コード名:Sierra Forest)をラインナップ

  • Xeon 6700Eシリーズは本日から発売

  • Xeon 6700Eシリーズのモデル一覧。6900EのSKUはまだ出ていないが、ダイが2つ並んで最大288コアになる

  • パッケージのバリエーション

  • Xeon 6900Pはかなり大きい

Pコア(Performance-core)とEコア(Efficient-core)の両SKUにより、AI等のの高性能コンピュート・ニーズから、スケーラブルなクラウドネイティブ・アプリケーションまで、幅広いユースケースとワークロードに対応するという。両SKUをまたがって、共有ソフトウェア・スタックと、ハードウェアおよびソフトウェア・ベンダーのオープンなエコシステムによる互換性がうたわれている。

  • EコアのXeonで、カバーできる範囲を拡げました、というイメージ

Xeon 6 Eは、高いコア密度ならびに物理コア数の多さと、電力比性能が特徴。高密度でスケールアウト型のワークロードに適しているとされる。性能は、2th Gen Xeon Scalableと比べると、同等性能ならラック数を1/3にでき、最大4.2倍のラックレベルの性能向上、最大2.6倍のワット当たり性能向上が可能とされる。

  • ラック数は1/3で省電力。家賃や電気代、環境対応はデータセンターのクリティカルな問題

  • これはEPYC比での性能アピール

  • Xeon 6の顧客からの評価

  • PコアはMeteor Lake世代のRedwood Coveなので、Hyper-Threadingは備わっている。なおXeon 6の製造プロセスはコンピュートタイルがIntel 3、I/OタイルがIntel 7。LunarLake以降でHTの扱いがどうなるのかは、Arrow Lakeが見えればわかるかもしれない

  • Xeon 6 Pの概要

  • 共通して備える主要機能

  • コンピュート・エクスプレス・リンク(CXL) 2.0をサポート。アクセラレータやメモリエクスパンダーなどの追加コンポーネントとの接続や通信が容易になる。Flat Memory ModeはXeon 6のみで利用可能な機能だ

Gaudi 3 - NVIDIA H100を強く意識した性能と価格のターゲット

NVIDIAの独走を各社が必至に追うデータセンター向けAIアクセラレーターで、Intelが今年中の市場投入を発表している次期製品が「Gaudi 3」。今回は、このGaudi 3のAIキットの価格が発表された。

  • Gaudi 3のOAM(Open Accelerator Module)

Gaudi 3は第5世代Tensor Processorを64基搭載し、Matrix Math Engineを8基統合、128GBのHBM2eメモリを組み合わせて3.7TB/sのメモリ間帯域を実現する。製造にはTSMCの5nmプロセスを使っている。従来の「Gaudi 2」比だと、FP8で2倍、BF16で4倍のAI演算処理性能を提供するほか、ネットワーク帯域幅を2倍、メモリ帯域幅は1.5倍に拡大している。

  • Gaudi 3の主なスペック

  • 「Gaudi 2」比での強化ポイント

製品の提供形態はOAM(Open Accelerator Module)、OAMを8基搭載したユニバーサル・ベースボード、PCI Express(PCIe)カードの3種類を用意している。ほかOAMの冷却ユニットには空冷と液冷のオプションがある。

  • 製品の提供形態は3種類

  • 8基から8192基までの良好なスケーラビリティ

そして価格だが、Gaudi 3アクセラレーター×8基のユニバーサル・ベースボードキットで125,000ドル。これは「推定で、競合の同等プラットフォームの2/3のコスト」という。

  • Gaudi 3とGaudi 2のユニバーサル・ベースボードキットの価格を発表

この「競合」というのはNVIDIA H100と見られる。Gaudi 3は、主要な生成AIモデルのトレーニングと推論タスクで、同サイズのH100 GPUクラスタと比較した性能テストを実施し、優位な結果を得られたとアピール。一般的なLLMを実行した場合、対H100に平均で2倍高速だったと説明している。

同社の発表では、「Gaudiアーキテクチャは、大規模言語モデル(LLM)の学習と推論のため、NVIDIA H100に代わるMLPerfベンチマーク済みの唯一の選択肢。顧客が必要な生成AIの性能を、より低いコストで迅速に導入できるのがGaudiだ」と、名指しもしている。

なお、Gaudi 2の価格は、Gaudi 2アクセラレータ×8基のユニバーサル・ベースボードキットで65,000ドル。これは「競合の1/3のコスト」だそうだ。

  • 同等サイズのクラスタでH100と性能を比較

  • こちらはLLMでH100と、さらにH200とも比較

あわせて今回、Gaudiのシステム・プロバイダーとして、既存のDell、Hewlett-Packard、Lenovo、Supermicroに加えて、新たにAsus、Foxconn、Gigabyte、Inventec、Quanta、Wistronの6社が加わったことも発表された。

  • 新たに加わったGaudiのシステム・プロバイダー

  • Gaudiのシステム・プロバイダー、既存の4社

  • Gaudiの顧客。ボッシュやNAVERなど、日本でも一般に聞きなれた企業の名前もある

  • NAVERのGaudiの事例