ソフトバンク、幅広いAI処理を実行できる「AIデータセンター GPUクラウド」10月提供

ソフトバンクは、ネオクラウド事業として、AIデータセンター向けソフトウエアスタック「Infrinia AI Cloud OS」を搭載したクラウドサービス「AIデータセンター GPUクラウド」を10月から提供する。提供に先立ち、ベータ版を5月25日から提供開始し、ソフトバンクやグループ会社で利用開始した。

ソフトバンクが提供する「AIデータセンター GPUクラウド」

AIデータセンター GPUクラウドは、マルチテナント環境に対応した「Kubernetes as a Service」(KaaS)や、大規模言語モデル(LLM)の推論機能をAPIとして提供する「Inference as a Service」(Inf-aaS)を利用できる「Infrinia AI Cloud OS」と、ソフトバンクのAI計算基盤を組み合わせたクラウドサービス。

国内のデータセンターに構築した「NVIDIA GB200 NVL72」などのGPU搭載AI計算基盤を活用し、日本国内における安全なデータ管理・運用の下、AIモデルの学習から推論、データ処理まで幅広いAIワークロードを効率的かつ柔軟に実行できるという。

GPUの管理やKubernetesによる運用、AIワークロードの実行などを一元管理・自動化することで、開発環境の構築や計算リソースの調整にかかる手間を削減し、運用負荷とコストの低減を図るとしている。

ソフトバンクは主な特徴として、AIの学習用途から推論用途まで幅広いワークロードに対応するGPU環境を提供する点を挙げている。「NVIDIA GB200 NVL72」をはじめとするアクセラレーテッドコンピューティング基盤上で、高性能なGPU間通信とストレージを組み合わせ、LLMの学習や複雑な推論処理に適した環境を実現するという。

また、Kubernetesを活用することで、多数のコンテナを一元的かつ自動的に管理でき、開発環境の構成変更やスケーリングなどの運用負荷を軽減。さらに、Kubernetes上でのモデル推論基盤の構築・運用を自動化し、独自開発のAIモデルや任意のAIモデルを選択するだけで、推論環境を利用できるとしている。

ソフトバンクは今後、通信基盤を生かしてAI時代の社会インフラを構築する「Telco AI Cloud」構想に基づき、「AIデータセンター GPUクラウド」と「AI-RAN」を統合することで、学習から推論までのAI計算処理の最適化を図るとともに、低遅延・高信頼を実現するソブリン性を備えた分散型AIインフラの構築をめざす。