コンテナ型データセンター事業を手掛けるゲットワークスは4月22日、フィックスターズおよびNTTPCコミュニケーションズ(以下、NTTPC)と共同で、水冷GPUサーバの稼働環境整備に向けた取り組みを開始することを発表した。
取り組みの背景
GPUの性能向上に伴い、その消費電力と発熱量も増加している。従来の空冷技術では対応が困難となりつつあり、液体で熱を吸収する水冷方式の開発も進められている。しかし日本国内ではまだ水冷GPUサーバの本稼働実績が少ない。
その理由として、サーバベンダーごとに冷却仕様や対応しているCDU(Coolant Distribution Unit)機器が異なる、同一ベンダーでもGPUごとにCDU機器の選定が必要となる、データセンターへ水を引き込むことへの忌避感や設備改修コストの増加、建屋内へ引き込める水量の限界、水冷環境の構築ノウハウの不足などが考えられる。
各社の役割
ゲットワークスは再エネを活用したコンテナデータセンターを2014年から展開し、2024年にはスーパーマイクロ製のクーリングタワーを導入した。自社構築の水冷環境で水冷GPUサーバを本稼働させている。
各ベンダーから持ち込まれる最新情報や、水冷対応データセンター新設案件に内包する技術的課題に日々対応していることから、同社はこれらの実績や知見、施工技術などを提供する。また、実証の場として自社コンテナ型データセンター内に専用の検証コンテナを構築し、水冷環境における統合的な運用管理技術体系を確立させる。
フィックスターズは自社で保有する水冷GPUサーバを実証実験用に提供するとともに、GPUを活用したソフトウェア高速化やパフォーマンスチューニングの実績を用いて、システム全体の性能評価と信頼性検証を担当する。
また、AIワークロードにおけるボトルネックの特定と最適化、最新GPUアーキテクチャへの対応など、ソフトウェアの観点から本格導入に向けた技術支援も提供する。これにより高負荷なAI処理を安定かつ効率的に実行可能なインフラの実現に貢献するという。
NTTPCは複数の大規模GPUクラスタの提供実績があり、その経験を踏まえたハードウェアエンジニアリングの観点から検証に取り組む。CDUの立ち上げから立ち会い、機器のラックマウント、OSのインストールなどの初期構築をはじめ、サーバの負荷テストによる水の温度上昇と冷却の観察、空冷と比べた消費電力と冷却効率の相関に関するデータ収集など、水冷サーバならではの知見を蓄積するとのことだ。