SC17の展示者フォーラムで、ArmがHPCマーケットへの取り組みについてプレゼンテーションを行った。また、CrayやHPEがArmプロセサを搭載したHPC市場向けのサーバの発表、展示を行った。
ArmのHPC戦略の目標は、世界初のArmベースのスパコンを実現することである。そのために、実現を阻む問題を解決するEnablementやCo-Designを行い、パートナーと協力する。
Enablementとしては、具体的には、演算とデータ移動のギャップのアーキテクチャによる解決、Arm v8やSVE(Scalable Vector Extensions)をサポートするオープンソースのソフトウェアのエコシステムの立ち上げ、そして大規模システム用ソフトウェアのコンパイル、解析、デバグを行うツールの提供などを行う。
Co-Designは、米国のDoD、DoE、日本の理研やEUといった鍵となる顧客と協力してアーキテクチャやSoC、実用アプリなどを開発する。また、協力を進めるために、シミュレーションやモデル化のツールを開発する。
パートナーとの協力は、アーキテクチャパートナーと協力して最適化されたソリューションを素早く市場に届ける。ATGやマイクロアーキテクチャ設計チームと将来のHPCやHPDA(High Performance Data Analytics)、ML(Machine Learning)に適した設計に取り組む。主要ISVと協力して中流層市場に取り組むなどのアプローチを考えているという。
これまでもEUのMont Blancプロジェクトなどで、Armプロセサを使ったHPCマシンが開発されてきたが、競合するXeonに比べて性能が低いことから、商用化されることはなかった。
しかし、最近では、Xeonと比肩できる性能のArmアーキテクチャのサーバプロセサが出てきた。その1つがCaviumのThunderX2プロセサである。ThunderX2は、Out-of-Order実行コアを最大32コア集積する。そのため、初代のThunderXに比べて2~3倍の性能になっており、Xeonに対抗できる性能になっている。
そして、最大8チャネルのDIMMインタフェースを持ち、6チャネルのXeonのシステムと比較すると33%高いメモリバンド幅を持っている。HPCでもメモリバンド幅ネックとなる計算が多くなっているし、ビッグデータやマシンラーニングではメモリバンド幅が計算能力よりも重要であり、このような用途にはThunderX2は適している。
また、ThunderX2は、サーバクラスの仮想化やRAS機能も備えている。
QualcommのCentriq 2400もデータセンター向けのArmアーキテクチャのサーバ用プロセサである。まだ、Centriq 2400を使うサーバ製品は発表されていないが、Microsoftがクラウドデータセンターで使うと言われている。
なお、Centriq 2400は、DIMMインタフェースは6チャネルであるが、48コアを集積している。
(次回は12月22日に掲載します)