米AMDは11月8日(現地時間)、製品発表会「AMD Accelerated Data Center Premiere」をオンラインで実施し、その中で同社初のエクサスケールGPGPU(General Purpose Graphics Processing Units)「Instinct MI200」シリーズを発表した。オークリッジ研究所のスーパーコンピューター「Frontier」に採用されたほか、2022年第1四半期下からは主要なパートナーからも展開する。

  • マルチダイ構成を採用した「Instinct MI200」

今回発表されたのは、OCPアクセラレーターモジュール(OAM)仕様の「Instinct MI250X」「Instinct MI250」と、PCIeカード型の「Instinct MI210」3製品。この内OAM仕様のHPC向け製品については仕様が公開されており、Instinct MI250Xでは約580億個もの莫大な数のトランジスタを集積して搭載。FP64アプリケーションでは競合よりも最大で4.9倍も高速に処理できるとしており、スーパーコンピュータやデータセンターで卓越したパフォーマンスを提供するという。

仕様 Instinct MI250X Instinct MI250
Compute Units 220 208
Stream Processors 14,080 13,312
FP64 / FP32 Vector (Peak) Up to 47.9 TFLOPS Up to 45.3 TFLOPS
FP64 / FP32 Matrix (Peak) Up to 95.7 TFLOPS Up to 90.5 TFLOPS
FP16 / bf16 (Peak) Up to 383.0 TFLOPS Up to 362.1 TFLOPS
INT4 / INT8 (Peak) Up to 383.0 TOPS Up to 362.1 TOPS
HBM2e ECC Memory 128GB 128GB
Memory Bandwidth 3.2 TB/sec 3.2 TB/sec
Form Factor OCP Accelerator Module OCP Accelerator Module

アーキテクチャは6nmプロセスのCDNA 2で、メモリには広帯域なHBM2eを組み合わせて搭載。Elevated Fanout Bridge(EFB)技術によるマルチダイ構成を採用している点が最も大きな特徴で、これによってコア数は前モデルから1.8倍に増加。HBM2eのメモリ帯域幅は2.7倍の3.2TB/sという極めて高速なピーク性能を達成したほか、最大8本のInfinity FabricでCPUや他のPCIeデバイスと接続し、システムでのキャッシュコヒーレンシを保つことができるとしている。

  • カード型ではなく、OAM仕様のMI200シリーズ概要

  • 2つのコアと8つのHBM2eメモリを組み合わせていることがわかる

  • HPC領域では最大4.9倍も競合より高速。AIでも1.2倍高性能

  • NVIDIA A100比でも2倍以上の高い性能を実現した

  • PCIeカード型のMI210もComing soon

AMD Accelerated Data Center Premiere Keynote