「COMPUTEX TAIPEI 2024(COMPUTEX 2024)」の開催2日目にあたる6月5日に行われたSuperMicroの基調講演は、ある意味ちょっと独特なものだった。

メインテーマはもちろんNVIDIAとの協業であって、実際同日に出された同社のプレスリリースではHGX H100/H200 SuperClusterやB100/B200 SuperCluster、GB200 NVL36/NVL72 SuperClusterなどNVIDIAの最新データセンター向け製品をベースにしたラインナップを提供するというもの(Photo01)であったが、その前日となる6月4日にはIntelのXeon 6をベースとするX14 Serverを発表しているし、リリースこそは無かったものの基調講演の中ではAMDの次世代製品であるTurinやMI300Xシリーズをベースとした製品にも言及していた。

  • Jensen Huang氏とCharles Liang氏

    Photo01:NVIDIA製品への言及を始めたところで出現したNVIDIAのJensen Huang氏(左)と肩を組むCharles Liang氏(SuperMicro CEO兼社長、右)

同社は言わばWhitebox Serverの最大手であって、当然すべてのベンダーに対応した製品をリリースしてきた訳であるが、その中で今回NVIDIAに特に言及したのは、恐らくは群を抜いて消費電力が多いNVIDIAの製品が、SuperMicroの新しい戦略に上手くマッチするから、というあたりかと思われる。

DLCの採用推進を図るSuperMicro

そんなSuperMicroの新しい戦略は、サーバー内部にヒートパイプを通して冷却水を循環させてCPUとメモリを冷やすDLC(Direct Liquid Cooling)推しである。直近は生成AIの猛烈な人気もあって、データセンター向けの売り上げが急速に伸びているとする(Photo02)。

  • SuperMicroの売上高推移

    Photo02:SuperMicroの売上高推移。縦軸は100万ドル。ちなみに2024年4月30日付で発表された同社の2024年度第3四半期(2024年1-3月)決算の中では、通期売上予測を147億~151億ドルと示しており、これは2023年度の倍である

ここで登場するのが「Green Computing Can Be FREE with a BIG BONUS」というメッセージ(Photo03)。

  • なんとなくGreen Computingの意味合いが少し違う気はするのだが……

    Photo03:なんとなくGreen Computingの意味合いが少し違う気はするのだが……

要するにOperation Costを下げる選択をすることは、ユーザーにとってフリーランチが手に入るようなものだ、という話である。そのOperation Costを下げるための手法がDLCである。8000枚のGPU、あるいは1000台のNVIDIA HGX Systemを立ち上げる場合の、「部品以外」のコストを見てみると(Photo04)、DLCを使うことでデータセンターの建設費用はむしろ下がることが示されている。

  • DLCを利用しても別に追加コストは発生しない

    Photo04:要するにもう初期費用に関しては、DLCを利用しても別に追加コストは発生しない、という話である

IT System Cost、つまり管理費はDLCでは若干上がるが、トータルすると3%程度の初期費用低減につながるというものだ(Photo04)。

また、DLCというか液冷にまつわるこれまでの問題に対し、もはやSuperMicroからするといずれも問題は無い、とする。リードタイムは従来より遥かに短く、コストも空冷とそれほど変わらず、長時間運転も可能であるとしている訳だ。

  • 2024年度にSuperMicroが提供するサーバーの15%がDLCとなる

    Photo05:一番下の「15%」というのが、2024年度にSuperMicroが提供するサーバーのうちDLCを利用したシステムの目標比率である

では逆にDLCのメリットは何か? というと、サーバーの実装密度を引き上げながら、かつ高効率に冷却ができる事だ。実際NVIDIAの場合で言えば、HGX 200の空冷システム(Photo06)と比較して、DLCではラック当たりの実装密度を2倍に出来る(Photo07)。

  • このシャーシは液冷と空冷の両方が可能

    Photo06:このシャーシは液冷と空冷の両方が可能。ラック1本あたり4ユニットを格納できる

  • DLCに最適化したシャーシではラック1本あたり8ユニットを格納可能

    Photo07:DLCに最適化したシャーシではラック1本あたり8ユニットを格納可能

例えば256GPUのAI Super Clusterを構成する場合、空冷を前提にしたユニットだと9ラック構成(Photo08)になるのが、DLCだと5ラックで解決することになる(Photo09)。

  • 中央にNetwork Switchを挟んで合計9ラック構成

    Photo08:中央にNetwork Switchを挟んで合計9ラック構成

  • Network Switchの分は変わらないので、合計5ラック構成

    Photo09:Network Switchの分は変わらないので、合計5ラック構成

基調講演の中では、この5ラックを4つ並べた(つまり1024GPU)システムを20個並べた(20480GPU)システムを、1つのクーリングタワーで賄える的な説明も行われたが、これは流石に模式図であって実際の構成という訳ではないだろう。そもそも1つのSuperRackには256GPU+128CPUが載り、2GPU+1CPUで概ね1KW。つまりSuperRack全体で(Networkその他を無視しても)128KWほどになる。このSuperRackを4つ束ねたものが512KW、それを20個だと10MWを超える消費電力になる訳で、流石にこれを1つのクーリングタワーで賄うのは無理が過ぎる。ただ一般に空冷の場合、冷却効率の問題もあってラックあたり15KW程度が限界(実際Photo06のものは16KWほどになるから、冷却限界ギリギリである)と言われているし、これを並べて空気で冷却というのはそもそも空気の熱交換の効率があまり高くない事を考えれば、DLCを推したくなるSuperMicroの動機は非常に理解しやすい。

  • 最低でも冗長用にもう1台クーリングタワーは必要になるだろう

    Photo10:最低でも冗長用にもう1台クーリングタワーは必要になるだろう。というか、実際には1MWでも結構大変であり、20~30台のクーリングタワーが屋上に並ぶ構図になりそうだ

SuperMicroがどこまでデータセンター全体の構築に関わるか、というのはまだ明確ではないのだが、クーリングタワーの提供に加えてData Center Management Softwareの提供なども行うとしており(Photo11)、またDLC対応のサーバーの供給をさらに増やすための方策の1つとしてマレーシアに組み立て工場を現在建設中で、2024年第4四半期には操業を開始するとしている。

  • 恐らくこれはSuperMicroのサーバーのみをターゲットにしたものと思われる

    Photo11:ただ恐らくこれはSuperMicroのサーバーのみをターゲットにしたものと思われる。色々システムが混載した場合は大変そうだ

  • APAC Sceience and Tech Centerの生産能力は今後2~3倍に増強できる

    Photo12:ちなみに2024年度第3四半期の決算発表資料によれば、APAC Sceience and Tech Centerの生産能力は今後2~3倍に増強できるほか、現在北米に新しい工場の建設を検討しているとの事

これでDLC対応サーバーの比率を現在からずっと増やしてゆき、今年中に15%、将来的には出荷量の40%近くをDLC対応製品にシフトする予定、というのがSuperMicroの展望であった(Photo13)。

  • 昨年から確かに液冷ソリューションがぼちぼち出始めていたが、今年はこれが急加速されている感がある

    Photo13:昨年から確かに液冷ソリューションがぼちぼち出始めていたが、今年はこれが急加速されている感があり、SuperMicroはその急先鋒というべきなのかもしれない

Supermicro CEO Keynote at COMPUTEX 2024