富岳NEXTの開発にNVIDIAが参画
理化学研究所(理研)は8月22日、富士通と検討を進めてきた日本の次世代スーパーコンピュータ(スパコン)「富岳NEXT(開発コードネーム)」について、NVIDIAが参画し、理研を開発主体とした国際連携での設計と開発を進めていく方針を明らかにした。
NVIDIAの参画により、日本のフラッグシップスパコンシステムとして初めてGPUがアクセラレータとして採用されることとなる。
開発の分担は、全体システムおよび計算ノード、CPUの基本設計を従来通り富士通が、搭載されるGPU基盤部についてNVIDIAが設計を主導するとしている。
富岳NEXTのアプリケーション処理性能目標は富岳比で100倍
富岳NEXTは、日本の半導体および計算基盤の強化に貢献することに加え、先端的AI技術や計算基盤における日本の主権を確保しつつ、ハードウェアおよびソフトウェアの両面で、グローバルマーケットへの展開を通じた世界的なエコシステムを構築することを目指して開発されるスパコンという位置づけ。CPUには富士通が現在開発中の汎用CPU「FUJITSU-MONAKA」を発展させた後継CPU「FUJITSU-MONAKA-X(仮)」を採用するほか、アクセラレータとしてNVIDIAが設計する並列演算性能とメモリ帯域に優れたGPUを組み合わせ、そのCPUとGPU間の接続についても最先端の接続方式の採用を検討するとしている。また、先進的なメモリ技術の採用も視野に入れた基本設計を進めるとしており、こうした取り組みにより、既存の「富岳」と比べて富岳NEXTでは5倍以上のハードウェア性能を目指すとする。
核となるFUJITSU-MONAKA-Xは、超メニーコアとSIMD機能拡張による高いスケーラビリティで、数値シミュレーションなどHPCアプリケーションに対し高い処理性能を発揮するとともに、サーバ用としては世界初となる行列演算エンジン(Arm SME)も内蔵する予定で、低レイテンシなAI推論処理を実現するとしている。また、GPUとの組み合わせとしても、GPUとの広帯域な密結合により、AIトレーニングやGPUに最適化されたHPCアプリケーションでの高い処理性能を提供することで、高度なセキュリティを確保しつつも汎用ワークロードから数値シミュレーション、AI処理まで多様なコンピューティング需要に応えることを可能とするとしている。
また、アプリケーション性能の向上に向けて、混合精度演算の積極的な利用や低精度演算向けハードウェアを活用したOzakiスキームなどの高精度演算手法を利用するなどAI向けに搭載されたハードウェアの有効活用に加え、AIにより複雑な計算性能を代替させるサロゲートモデルやPINNの導入を含むアルゴリズムの最適化などといったソフトウェア面での革新も推進することで、ハードウェアによる高速化とは別に10~20倍のアプリケーション実行性能の向上を目指すとしており、約40MWという電力制約の中で、総合的に最大で100倍程度のアプリケーションの高度化および高速化を図ることを目指すとしており、FP8(スパース)で600ExaFlopsを超すAI向けハードウェア性能の実現が目標となるとしているが、HPC向けのスパコンとしてはZetta(ゼタ)スケールのスパコンシステムとなることが想定され、AIによる仮説の生成や検証、そのためのコードの生成、物理的な実験の自動化など、「AI for Science」の推進による科学的な価値発見のプロセス全体をさらに加速させることも目指すとしている。
GPUの活用に向けた取り組みも推進へ
理化学研究所では、GPUを活用していくという方向性を踏まえ、GPUへの移植や最適化の支援のほか、「AI for Science開発用スーパーコンピュータ」などのCPU/GPUマシンの活用を含めた富岳NEXTテストベッドの構築を進めていく予定としている。
なお、開発スケジュールとしては、2025年度内の基本設計完了を経て、2026年度以降に詳細設計に進む予定。理研としては、米国・エネルギー省(DOE)傘下の研究所を含む世界的なHPCの研究所とも国際連携体制を構築して、ソフトウェアやアルゴリズムの開発を進めることも想定し、富岳NEXTを中核としたエコシステム構築を進めていくとするほか、文部科学省(文科省)の「次世代HPC・AI 開発支援拠点形成事業」とも連携しながら、2030年ごろの富岳NEXT稼働の時代を見据え、AI for Scienceなどの新たな科学技術分野における新規アプリケーションの創出や、量子コンピュータとのハイブリッド環境構築に向けて開発が進められているソフトウェアスタック群の活用に向けた適用の推進なども図っていく予定だという。
また理研では、日米共同で富岳NEXTの開発を進めることで、新たな世界標準となる「AI-HPCプラットフォーム」を確立し、仮説の生成・検証やコード生成、物理実証の自動化までを含む科学全体のサイクルを飛躍的に加速・高度化するAI for Scienceのな加速を実現したいとしている。
