さくらインターネットは10月20日、オンラインで説明会を開き、「NVIDIA Blackwell GPU」を採用したマネージドスーパーコンピュータ「さくらONE」の提供開始を発表した。なお、9月末に先んじて「NVIDIA H200 GPU」採用したプランを発表している。
さくらのAI需要への対応
さくらONEは、計算環境の立ち上げから日常的な運用管理までを一括で支援するマネージドサービスであり、最低30日から1日単位で利用できるため、システム構築の負担なく、すぐに高性能な計算環境を活用できるというもの。
さくらインターネット AI事業推進室 AI基盤事業統括の須藤武文氏は「LLM(大規模言語モデル)の事前・事後学習に対応し、メモリも大規模に備えるなどコストパフォーマンスが良い」と、新サービスを評価する。
同社では、大規模なクラウドインフラが存在しない日本においてAIの発展を加速させ、GPUリソースの安定供給を確保するため、2027年度までに約1000億円を投じて合計18.9EFLOPS(エクサフロップス)の大規模クラウドインフラの整備を石狩データセンター(北海道石狩市)で進めている。
2023年6月に経済安全保障推進法に基づく特定重要物資である「クラウドプログラム」の供給確保計画に関する経済産業省の認定を受け、2024年4月にも同認定を受けた。2025年3月期にNVIDIAのGPU「H100」「H200」を中心に2840基、すでに今期(2026年3月期)は1472基の設置が完了し、計算能力は昨年から倍増以上の4.81EFLOPSを達成している。
石狩データセンターでは、今期中に1100基のGPUを設置するとともに、第2期コンテナ型データセンターの構築を予定し、2027年3月期以降は第3期コンテナ型データセンターの構築を予定するなど、AIの需要に対応する。また、8月にはAI事業に関する機能を1つの部門に集約し、戦略・企画・開発・営業が連携するために「AI事業推進室」を新設。
科学技術とAIの領域をカバーするスパコン「さくらONE」
こうした状況において同社は、さくらONEに加え、生成AI向けクラウドサービス「高火力」シリーズとして、ベアメタル型GPUクラウドサービス「高火力 PHY」、VM(仮想マシン)型GPUクラウドサービスの「同VRT」、コンテナ型GPUクラウドサービス「同DOK」をそれぞれ提供している。
今回、新たに提供するさくらONEは、LLM(大規模言語モデル)の学習や生成AIの研究開発に特化した設計となり、低精度演算(FP8/FP4)に最適化。NVIDIA Blackwell GPUを8基搭載し、最大48台、合計384基のGPUリソースを同時に活用できるという。これにより、幅広い計算需要に対応する高性能な計算リソースを、国内から提供が可能になる。
すでに、提供中のNVIDIA H200 GPUモデルは高精度演算であり、CFD・医療・防災など科学技術計算に最適化し、最大55台、合計440基のGPUリソースを持つ。両モデルを揃えることでさくらONEは、科学技術とAIの両領域をカバーするスーパーコンピュータとして利用できるとのこと。
昨今では推論のニーズ拡大により、同社の高火力シリーズに加え、さくらONEや生成AIプラットフォームを提供することで、さまざまなユースケースに対応していく考えだ。
さくらインターネット AI事業推進室/さくらインターネット研究所 上級研究員の小西史一氏は「スパコンのようなシステムは動かそうとしたら、ハードウェアからソフトウェア、運用までと一貫した知識と経験が必要となる。新サービスはマネージドサービスのため、大規模な計算能力をすぐに利用できる。計算環境の立ち上げから日常的な運用管理までを一括で支援する」と話す。
AI開発や先端研究には、高い演算能力を持つ計算インフラが必要だが、このような環境はこれまで一部の機関に限定されていた。マネージドスーパーコンピュータである、さくらONEを商用環境で提供することで、多くの企業や大学、研究機関が先進的なAIを開発できる社会を実現する。
現在、スパコンの性能ランキング「TOP500」では世界49位と認定されており、今後は2025年11月に開催されるTOP500へのエントリーも予定し、性能向上に向けた取り組みを継続すると同時に、ランキング上位を目指す。同社では次世代GPUの継続的な調達・整備を行い、用途や目的に応じた最適なデジタルインフラを開発し、生成AI需要に応える高付加価値サービスを創出していく考えだ。



