Arm,Software and Large Systems ResearchのEric Van Hensbergen氏

ARMのHPCマーケットへの取り組みを発表するArm,Software and Large Systems ResearchのEric Van Hensbergen氏

SC17の展示者フォーラムで、ArmがHPCマーケットへの取り組みについてプレゼンテーションを行った。また、CrayやHPEがArmプロセサを搭載したHPC市場向けのサーバの発表、展示を行った。

ArmのHPC戦略の目標は、世界初のArmベースのスパコンを実現することである。そのために、実現を阻む問題を解決するEnablementやCo-Designを行い、パートナーと協力する。

Enablementとしては、具体的には、演算とデータ移動のギャップのアーキテクチャによる解決、Arm v8やSVE(Scalable Vector Extensions)をサポートするオープンソースのソフトウェアのエコシステムの立ち上げ、そして大規模システム用ソフトウェアのコンパイル、解析、デバグを行うツールの提供などを行う。

Co-Designは、米国のDoD、DoE、日本の理研やEUといった鍵となる顧客と協力してアーキテクチャやSoC、実用アプリなどを開発する。また、協力を進めるために、シミュレーションやモデル化のツールを開発する。

パートナーとの協力は、アーキテクチャパートナーと協力して最適化されたソリューションを素早く市場に届ける。ATGやマイクロアーキテクチャ設計チームと将来のHPCやHPDA(High Performance Data Analytics)、ML(Machine Learning)に適した設計に取り組む。主要ISVと協力して中流層市場に取り組むなどのアプローチを考えているという。

  • ArmのHPCマーケットへの取り組み

    ArmのHPCマーケットへの取り組み。EnablementとCo-Design、パートナーを作り、パートナーと協力するというのが3本柱である (この連載のすべての図は、ArmのHensbergen氏の発表スライドを撮影したものである)

これまでもEUのMont Blancプロジェクトなどで、Armプロセサを使ったHPCマシンが開発されてきたが、競合するXeonに比べて性能が低いことから、商用化されることはなかった。

しかし、最近では、Xeonと比肩できる性能のArmアーキテクチャのサーバプロセサが出てきた。その1つがCaviumのThunderX2プロセサである。ThunderX2は、Out-of-Order実行コアを最大32コア集積する。そのため、初代のThunderXに比べて2~3倍の性能になっており、Xeonに対抗できる性能になっている。

そして、最大8チャネルのDIMMインタフェースを持ち、6チャネルのXeonのシステムと比較すると33%高いメモリバンド幅を持っている。HPCでもメモリバンド幅ネックとなる計算が多くなっているし、ビッグデータやマシンラーニングではメモリバンド幅が計算能力よりも重要であり、このような用途にはThunderX2は適している。

また、ThunderX2は、サーバクラスの仮想化やRAS機能も備えている。

  • 採用するHPCサーバの発表が相次ぐCaviumのThunderX2ファミリ

    採用するHPCサーバの発表が相次ぐCaviumのThunderX2ファミリ。最大32コアを搭載し,DIMMインタフェースを最大8チャネル持っている

QualcommのCentriq 2400もデータセンター向けのArmアーキテクチャのサーバ用プロセサである。まだ、Centriq 2400を使うサーバ製品は発表されていないが、Microsoftがクラウドデータセンターで使うと言われている。

なお、Centriq 2400は、DIMMインタフェースは6チャネルであるが、48コアを集積している。

  • Microsoftが採用という噂のあるQualcommのCentriq 2400サーバプロセサ

    Microsoftが採用という噂のあるQualcommのCentriq 2400サーバプロセサ

(次回は12月22日に掲載します)