2021年6月28日に発表された第57回Top500は、Top10ではLawrence Berkeley国立研究所のPerlmutterが5位に入ったのが唯一の変化で、前回からの変動が少ないTop500発表となった。
Top500の1位をキープし、3連覇を達成したスーパーコンピュータ(スパコン)「富岳」は、富士通のArmアーキテクチャを採用したA64FX CPUを計算エンジンとして使うスパコンで、他のTop10スパコンがGPUをアクセラレータとして使っているのに対して、Armのベクタアーキテクチャの演算器を使っているのが特徴である。そして、48コアのCPUチップを1つの計算ノードとしている。計算ノードを接続するネットワークは、他のシステムではInfiniBandを使うものが多いのであるが、富岳は、京コンピュータの時に開発した6次元トーラス―メッシュ接続のTofuという名前の自社開発のネットワークを改良したTofu-Dを使っている。
次の2つの表は、Top500の最上位10システムの諸元をTop500のフルの表から抜き出したものである。
Name欄はシステムの名称、Computer欄はCPU、アクセラレータとして何を使っているか、インタコネクトは何を使っているかなどが書かれている。Site欄は設置場所、Total Core欄はCPUのコア数とアクセラレータコア数の合計、Accelerator/Co-Processor Cores欄はアクセラレータだけのコア数を示している。
そして、Rmax欄はHPLを実行したときの性能、Rpeak欄はCPUとアクセラレータの全部の演算器が理想的に動いた場合のFlopsである。そして、Power欄はHPLを実行しているときの消費電力、Power Efficiency欄はHPL性能を消費電力で割った電力効率値である。
Rpeak欄はいわゆる理論最大性能で看板として目立つ値であるが、実際の計算では、理論最大性能の何%の性能が得られるかが問題である。また、ある性能を実現するのに必要な電力は少ない方が望ましく、演算性能/W欄の値が重要な指標になる。
この表を見て目立つのは、中国のSunway TaihuLightとTianhe-2Aの電力効率が日、米、欧のシステムと比べて低い点である。これらの中国のスパコンが比較的古いことも影響しているが、まだ、スパコンの電力低減の技術に差があることを示している。しかし、追いつく方は比較的容易で、中国は急速に差を詰めてくると考えられるので、リードを維持するにはたゆまぬ努力が必要である。
今回のTop10での新顔となるPerlmutterはCrayのShastaスパコンで、AMDのEPYC CPUとNVIDIAのA100 GPUを使っている。PerlmutterはHPLの実行で64.6PFlop/sを出して5位に入った。また、PerlmutterはPower Efficiencyで25.55GFlops/WとTop10スパコンの中で最高の電力効率を出している。
Top500で上位に顔を出すのは、国家のフラグシップスパコンが多い。しかし、今回のTop500では民間企業であるNVIDIAのSeleneが6位に入っている。NVIDIAはGPUの最大手で、このところのNVIDIA株の値上がりで企業価値ではIntelを抜いて最大の半導体企業になった。NVIDIAはAI関係の研究に力を入れており、これらの計算処理のために大きなスパコンを必要とするので、自社に大きなスパコンを設置している。
なお、今回Green500で1位を奪還した日本のPreferred Networks(PFN)の「MN-3スパコン」は自社のAI計算需要を賄うために自社開発したスパコンであり、自社の研究開発のために、企業がスパコンを設置するという流れが出てきている。
そして、9位のHPC5はイタリアの半国有の石油、ガス会社であるEniのスパコンである。石油やガスの探査のために地層からの音波の反射を捉え、それから、地層の形を逆計算で推定し、石油やガスが有るかを計算するためにスパコンを使っていると思われる。
今回のTop500で面白いのは、Azureの4つのクラウドが26位から29位を占め、41位はAmazon EC2で作られたスパコンを使っている。昔は、クラウドデータセンターは比較的負荷の軽い処理をたくさん並列に実行するもので、HPC処理には適していなかったという時代もあったが、最近ではAmazonやMicrosoftのクラウドはHPCも主要用途として狙いを定めて来ている。ということで、ユーザ側もクラウドでHPCという流れが出てきている。
そして、電力効率を競うGreen500で、Preferred NetworksのMN-3スパコンが、29.7GFlops/Wを出して1位を奪還した。第2位となったのはHiPerGator AIというフロリア大学のスパコンである。中身はAMDのEPIC CPUとNVIDIAのA100 GPUであるので、NVIDIAのSuperPodスパコンとほぼ同じである。HiPerGator AIは29.52GFlops/Wで、僅差である。
Preferred NetworksのMN-3スパコンはCPUコア数、アクセラレータコア数は、昨年11月のデータと同じであり、ハードウェアは変わっていない(電圧、クロックなどは変更されている可能性はあり)と思われる。しかし、Rmaxが1,652.9から1,822.40に向上し、消費電力は65.39kWから61.36kWに低減し、結果として電力効率が26.039GFlops/Wから29.70 GFlops/Wに向上している。Preferred Networksは、「ソフトウェアの改良と、計算機システム全体の電力利用の効率化」でこれを実現したと発表している。MN-3の多数のSIMD演算器へのデータの割り付けを改善し、データ移動のエネルギー消費を削減したのではないかと思われる。