NVIDIAは5月31日、エージェント型AIの高性能処理に対応する新CPU「Vera」を正式発表した。エージェント型AIの処理を支えるCPUとして設計された製品であり、GPU中心だったAIインフラの構造に変化をもたらす可能性がある。

  • Vera CPU搭載サーバラックのイメージ

    Vera CPU搭載サーバラックのイメージ (出所:NVIDIA)

AIの進化で顕在化するCPUボトルネック

生成AIは従来の応答生成から、ツール実行やコード生成、推論の連鎖といった複雑な「エージェント型処理」へと進化している。

こうした処理ではGPUによる演算だけでなく、データ処理、プログラム実行、ワークフロー制御といったCPU依存の負荷が急増しており、AIシステム全体の性能を制約する新たなボトルネックとされるようになっている。

エージェント処理向けCPUとして設計されたVera

Veraはこうした課題に対応するために設計されたCPUであり、従来の汎用CPUとは設計思想が異なる。

88コア構成の独自コア「Olympus」を採用し、大量の並列タスク処理とデータ移動に最適化されている。これにより、Python実行やデータ処理、コード生成といったAIエージェント特有の処理を高速化する。

性能面ではx86 CPUに比べて約1.8倍の処理速度を実現し、AIワークロードにおけるCPU処理の効率を向上させるとする。

GPUと一体化しAIシステムを再設計

またVeraは単体CPUにとどまらず、「Vera Rubin」プラットフォームの中核としても定義されている。

Vera RubinプラットフォームではCPUとGPUをNVLinkで直接接続し、高帯域かつ低遅延でデータをやり取りする。これにより従来のPCIe接続よりも効率的な処理が可能となり、AIシステム全体のスループットが向上する。

さらに、サーバラック単位でAI処理を最適化する設計が採用されており、次世代データセンターの基本単位として位置付けられている。

AIファクトリー構想の中核へ

Veraは、NVIDIAが提唱する「AIファクトリー」構想の中核コンポーネントに位置づけられる。

同構想では、AI処理は単なる計算ではなく、データ生成と推論を繰り返す“生産プロセス”として扱われる。このため評価指標も1ドルあたりの「演算性能」から1ドルあたりの「トークン生成効率」へと移行するという。

Veraはこうした新しい処理モデルに対応するため、CPUレベルでの効率最適化を担う役割を持つものとなる。

Vera RubinでAI処理能力を前世代比10倍へ

Vera Rubinシステムは、複数ラックを統合したPOD構造を採用し、前世代に比べて最大10倍のエージェント処理スループットを実現する。これにより、大規模AIモデルの実用運用に対応するインフラを構築できるとされる。

エージェント型AIがCPU市場における新たな競争軸に

これまでデータセンターCPUはx86を中心に発展してきたが、AI用途の進展により、ワークロード特化型CPUの必要性が高まっている。

Veraはこうした流れの中で登場した製品であり、従来の汎用CPUかGPUかといった構図から、「AI専用CPU」「AI専用GPU」「専用インターコネクト」を組み合わせたシステムへと最適化競争が移行していることを示すものとなる。

AIがCPUを再定義する時代へ

AIのエージェント化によりCPUの存在感が再び高まりを見せるようになってきた。これまでのAIサーバにおけるCPUとGPUの比率は1:8と言った具合であったが、これが1:4へ、そして1:2、1:1へと移行しようとしており、IntelもCPUニーズが高まっていることを公言している。

エージェント型AI時代においては、CPUが担う役割が従来型のAIモデルと比べて圧倒的に増えてくることが背景にあるわけだが、Veraはそうした変化に対応するNVIDIAとしての解であり、自社のGPUとの組み合わせの最適解として提案されることとなる。

これまでAIインフラといえばGPUの性能競争の中心であったが、Veraの登場によりGPUだけでなく、CPUについても性能競争の中心に位置づけられることになると見られる。