ソフトバンクはAMDと連携し、次世代AIインフラの計算資源としてAMDのGPU「Instinct」を活用するための共同検証を開始した。この共同検証のデモを、スペイン・バルセロナで現地時間3月2~5日まで開催されるイベント「MWC Barcelona 2026」のAMDブースで実施予定だ。

  • オーケストレーターによるAMD Instinct GPUの制御イメージ

    オーケストレーターによるAMD Instinct GPUの制御イメージ

生成AIの活用が進む中、大規模言語モデル(LLM)などのAIモデルを活用したアプリケーションの需要が拡大し続けている。LLMでは特に、AIモデルのパラメーター数や同時実行数によって必要な計算資源が大きく異なるため、計算資源を一律に割り当てるとGPUリソースのひっ迫や余剰などが発生し、非効率な運用となる場合がある。

今回の検証では、ソフトバンクが開発を進めている“オーケストレーター”の拡張機能を採用。オーケストレーターは、計算資源の管理やAIアプリケーションの最適な配分を行う仕組みを備えている。この拡張機能は、ソフトバンクがAMDと連携して開発したもので、Instinct GPUが備える“GPUパーティショニング機能”(1台のGPUを複数の論理デバイスとして利用可能にする機能)を活用している。

同機能では、AIアプリケーションのモデルの規模や同時実行可能数などの要件に応じてGPUを分割し、柔軟かつ最適に割り当てられる。これにより、1台のGPU上で複数のAIアプリを効率的に動作させられ、GPUリソースのひっ迫や余剰の発生を抑えた運用を実現できるとしている。

アーキテクチャーやオーケストレーターの制御方法などの技術的な詳細は、ソフトバンク 先端技術研究所のブログ記事を参照のこと。ソフトバンクとAMDは、今後も次世代のAIインフラにおけるAMD Instinct™ GPUの活用の可能性について技術評価を進めていく。