NECは5月17日、AI研究用スーパーコンピュータの構築を開始したと発表した。2023年3月に国内企業で最大規模の580PFLOPS(ペタフロップス)超となるシステムの稼働を予定する。同スーパーコンピュータは自社の数百名のAI研究者の利用を想定したもので、同社は構築にあたって数十億円を投じる。

  • AIスーパーコンピュータのマシン室完成予想図

すでに一部のシステム(100PFLOPS)についてはAI研究者が利用を開始しており、今後構築する480PFLPOSのシステムを加えてAIに特化した研究開発環境を整備することで、より高度な先進AIの迅速な開発に役立てるねらいだ。

今回開発するスーパーコンピュータは、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載した最新GPUサーバ116台(スーパーマイクロ社製)と、16PB超のEXAScaler高性能並列ファイルシステム(データダイレクト・ネットワークス社製)を搭載したストレージアプライアンスで構成される。

理論上の処理性能は580PFLOPS超となり、数千万枚の画像を数分間で学習可能だという。また、ネットワークには、高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用し、全サーバを200GbEで接続してRoCE(RDMA over Converged Ethernet)v2により超高速・低遅延での通信を行うことで、高速な分散学習を実現する。

同社はKubernetesを中核とした独自の構築技術により、これらのハードウェアとソフトウェア群を密に結合することで、高性能かつ利便性の高いシステムの構築を進める。

また将来的には、同スーパーコンピューターを活用して、顧客企業やパートナーとNECのAI研究者が集い、先進的な社会価値を共創するAI研究のセンター・オブ・エクセレンスの実現を目指す。