米VMwareは8月21日(米国時間)より、米ラスベガスで年次カンファレンス「VMware Explore 2023」を開催している。同社は22日、同カンファレンスの基調講演で、企業向け生成AI(人工知能)プラットフォームの「VMware Private AI Foundation with NVIDIA」を発表した。NVIDIAとの戦略的提携の一貫で、2024年初頭より提供を開始する。
VMware Private AI Foundation with NVIDIAは、生成AI向けに最適化されたNVIDIAの大規模言語モデル(LLM)開発用プラットフォーム「NVIDIA NeMo」と生成AIを、VMware Cloud Foundation上に統合したソリューション。ベアメタルに匹敵するパフォーマンスで実行できる環境を、VMware Cloud Foundationで提供する。
VMware Cloud Foundationは、VMwareが提供するクラウドサービス「VMware Cloud」で採用されているアーキテクチャや技術要素に基づいた仮想化基盤のフレームワークを指す。
VMware Private AI Foundation with NVIDIAの活用により、企業は自社で所有する独自データを取り込み、VMwareのハイブリッド・クラウド・インフラ上で自社に最適な形でAIモデルをカスタマイズし、業務内容に特化したチャットボットやアシスタント、検索、要約などの生成AIアプリケーションを開発・実行できる。
同社は「企業はよりセキュアでプライベートなモデルを社内向けに作成し、生成AIをサービスとしてユーザーに提供できる。VMware Cloudクラウドインフラ上で稼働する数十万の企業を生成AIの時代に対応させられる」としている。
強みは最大16個のvGPU/GPUを複数ノードにスケール可能な点
VMwareでクラウドプラットフォーム担当バイスプレジデントのPaul Turner(ポール ターナー)氏は、VMware Private AI Foundation with NVIDIAの優位性について以下のように説明する。
「単なるソフトウェアの組み合わせではなく、AIの最適化に必要な最新技術をスタックに組み込んでいる。特に(搭載予定の)DeepLearning VMはカスタマイズされた機械学習であり、適切なツールとスタックを装備している。大規模言語モデルのトレーニングや最適化、チューニングに求められるベクトル・データベースを活用するのに最適なハイパフォーマンス ハードウェアの構築も、NVIDIAとカスタム統合した。仮想化環境におけるGPUスケーリングの最適化で、AIワークロードを単一の仮想マシン内最大16個のvGPU/GPUを複数のノードにわたってスケールできる。これにより生成AIモデルの微調整とデプロイの高速化を実現する」
ストレージ高速化の観点では、GPUdirect RDMA(Remote Direct Memory Access)を搭載した。GPUdirect RDMAは高性能なGPU間通信を実現する機能。GPUの高速なパッシングと相互接続を可能にする。
Turner氏は「企業向け生成AIの実行は多くのGPUが同時に必要になることが多く、GPUdirect RDMAの搭載はそうしたニーズに対応したものだ。これによりストレージからGPU、GPUからGPUへIOをNVMe(※)へダイレクトパススルーできる」と説明する。
※NVMe:Non-Volatile Memory Express。不揮発性メモリを使用したストレージに採用されている規格
ハードウェアは大規模データセンター向けGPUの「NVIDIA L40S」、 並列処理に最適化されたDPUの「NVIDIA BlueFieldR-3」、高性能NICの「NVIDIA ConnectX-7 SmartNIC」をサポートする。NVIDIA L40Sは、「NVIDIA A100 Tensor Core GPU」と比較して、最大1.2倍の生成AI推論性能と最大1.7倍のトレーニング性能を発揮するという。当初はDell Technologies、Hewlett Packard Enterprise、Lenovoの3社からVMware Private AI Foundation with NVIDIAに最適化された製品がリリースされるとのことだ。
-
VMwareが訴求するVMware Private AI Foundation with NVIDIAの4つのメリット。「柔軟な選択肢」「安全な展開」「パフォーマンスの最適化」「ハードウェア機能のブースト」を掲げている
基調講演にVMwareとNVIDIAのCEOが登壇
8月22日の基調講演に登壇した米VMwareでCEOを務めるRaghu Raghuram(ラグー・ラグラム)氏は、企業が生成AIを活用する必要について「創造性や経済効率性を(以前とは)比較にならないほど向上させられる。(中略)企業は自社に特化した生成AIアプリケーションで、イノベーションを加速させられる」と説いた。
また、NVIDIAの創業者兼CEOであるJensen Huang(ジェンセン・フアン)氏も基調講演に登壇し、以下のようにコメントした。
「VMware Private AI Foundation with NVIDIAは、生成AIの可能性を引き出すために必要なフルスタックのソフトウェアとコンピューティングを提供するものだ。(VMware Private AI Foundation with NVIDIAを構築するために)両社の何百人にも及ぶエンジニアが連携した。VMwareは今年で創業25年だが、企業向け生成AIの提供は、将来に向けてエンタープライズコンピューティングを再構築するようなものだ」