米AMDは、次世代AI GPU「AMD Instinct MI430X」がAIや高性能コンピューティングの最前線をどのように前進させるかを詳説したブログ記事を、11月19日に公開した。
このGPUは次世代AMD CDNAアーキテクチャを基盤とし、432GBのHBM4メモリと19.6TB/sのメモリ帯域幅を装備。最も要求の厳しいAIおよび科学技術ワークロードを加速するとアピールしており、既に次世代スーパーコンピュータ(スパコン)となる米国「Discovery」や欧州「Alice Recoque」への採用が決まっている。
米オークリッジ国立研究所(ORNL)に導入されるDiscoveryは、米国初のAIファクトリー・スーパーコンピュータのひとつとして機能する。Discoveryでは、HPE Cray GX5000スーパーコンピューティングプラットフォーム上で、AMDのMI430X GPUと、開発コードネーム「Venice」で知られる次世代EPYCプロセッサを活用。エネルギー研究や材料科学、生成AIにおける科学計算を推進しながら、米国の研究者が大規模AIモデルのトレーニングなどを行うことを可能にする。
また、欧州のエクサスケール級システム・Alice Recoqueでは、Evidenの最新BullSequana XH3500プラットフォームを採用し、AMDのMI430X GPUとVeniceプロセッサを統合。倍精度HPCとAIワークロードの両方で卓越した性能を発揮し、厳しい省エネ目標も達成しながら科学的ブレークスルーを加速するとしている。
AMDではHPC分野において、「MI250X」、「MI300A」といったアーキテクチャを投入してきており、最新のMI430Xでは「ハードウェアベースFP64精度と先進的なAI機能」で、この分野でのリーダーシップを継承。「科学計算とAIトレーニングが同一プラットフォーム上で共存可能となり、性能・精度・スケーラビリティのいずれにおいても妥協を許さない」としている。
MI430XとAMD ROCmソフトウェアと組み合わせることで、データセンターからスーパーコンピューティング環境まで、フルスタック互換性とスケーラビリティを提供。ROCmはPyTorch、TensorFlow、JAXなどの主要フレームワークとの統合を継続し、数千台のGPUでトレーニングと推論の両方のパフォーマンスを最適化するとのこと。
