中国の次期HPCプロジェクトについて講演するDepei Qian教授

早稲田大学(早大)で開催されたSISA(A Strategic Initiative of Computing: System and Applications)ワークショップにおいて、中国の北京航空航天大学と中山大学の教授を兼任するDepei Qian氏が、「China's New Project on HPC development」と題して中国の次世代スパコン開発プロジェクトについて講演を行った。主催者のGao教授の紹介によると、Qian教授は中国の国家高度化を目指す863計画の主要メンバーで、中国のスパコン開発のキーパーソンという。

中国は5カ年計画でHPC開発を行ってきており、2010年から2016年には、100PFlopsのスパコンの開発、大規模HPCアプリケーションの開発、CNGridの拡充を行った。

CNGridは次の図のように、中国全土をカバーするグリッドで、現在は14ノードであるが、来年には16ノードになる。現在の計算パワーは8PFlopsであるが、天河2号(100PFlopsにアップグレード)と太湖之光も接続する予定である。現在の記憶容量は15PBで、400以上のソフトウェアがツールやサービスとして動いている。そして、3000以上のプロジェクトがCNGridを使っているという。

CNGrid。現在は右の表の14サイト。天河2号と太湖之光も接続する予定 (このレポートのすべての図は、SISAワークショップにおけるQian教授の発表スライドを撮影したものである)

これまでの開発で問題と考えられる事項として、Qian教授は次のスライドを示した。プロセサやアクセラレータ、メモリなどのテクノロジや大規模並列アルゴリズムなどで中国は遅れている。アプリケーションソフトも弱い、領域をまたぐ知識をもった人材が不足などをあげているがこれらの項目は日米欧の発表でも見られるものである。筆者の見るところ、同じ問題意識を持つというのは、遅れているというよりも、中国が追いついて並んできているという印象である。

Qian教授があげた中国の問題点。これらは日米欧でも事情は同じように見える

新しい5カ年計画を始めるにあたって、100以上存在した国家R&D計画を基礎研究、メガサイエンス、キーR&D(従来の863、973計画)、企業改革、施設や人材プログラムの5分野に集約するという。

新しい5か年計画に向けて、R&Dを5分野にまとめ直す

HPCは優先度の高い項目と認められ、第13期の5カ年計画に盛り込まれ、2016年2月から開始されている。

次期スパコンの開発は優先順位の高い項目として第13期の5カ年計画に盛り込まれ、2016年2月から開始されている

開発の目標は、(1)HPCの核となるテクノロジのR&Dを強化し、HPC開発の主導的地位を追求する、(2)HPCアプリケーションを推進する、(3)HPCインフラストラクチャを構築してHPCサービスインダストリ化を目指すことである。そのための主要なタスクは、(1)次世代のスパコンの開発、(2)HPCアプリケーションの開発、(3)CNGridのアップグレードと変革である。

次期スパコン開発プロジェクトの目標と主要なタスク

エクサスケールのスパコンの開発というタスクに対しては、次世代スパコンの新規なアーキテクチャやキーテクノロジのR&Dと自前のプロセサに基づくエクサスケールコンピュータの開発を行う。また、ハイエンドサーバの開発への技術移転を行っていく。

次世代スパコンの新規なアーキテクチャやキーテクノロジのR&Dと自前のプロセサに基づくエクサスケールコンピュータの開発を行う

そして3Dテクノロジやシリコンフォトニクス、オンチップネットワークなどを利用する新規な高性能インタコネクトと、ヘテロシステム向けの新しいプログラミングと実行モデルの研究を行う。

シリコンフォトニクスなどを使う新しいインタコネクトや、ヘテロシステム向けの新たなプログラミングモデルの研究を行う

そして、エクサスケールのテクノロジを確認するためにプロトタイプ機を作る。プロトタイプ機は512ノードで、各ノードは5-10TFlopsの性能で、10-20GFlops/Wの電力効率を持つ。インタコネクトは200Gbps以上のバンド幅を持ち、MPIのレイテンシは1.5μs以下を目指す。

このプロトタイプを開発するに当たって、自前のテクノロジを使うことに重点が置かれている。天河2号のアップグレードが米国のKNLの禁輸で方針変更となり、自前のFTプロセサ/アクセラレータの開発が行われている。結果として、天河2号の100PFlopsアップグレードの予定が遅れていることの反省が、このような方針に反映されている。

そしてプロトタイプ機のシステムソフトウェアの開発も行い、3つのアプリケーション動かして設計の妥当性を確認する。

エクサスケールのテクノロジを確認するため、プロトタイプ機を開発する

そして、本番の次世代機は、ピーク演算性能はExaFlopsで、Linpack効率は60%以上という目標である。メモリは10PB、ストレージはExaByte、エネルギー効率は30GFlops/W、インタコネクトバンド幅は500Gbps以上を目指す。

また、大規模なシステムマネジメントやリソーススケージュール機能を持ち、使いやすい並列プログラミング環境、システム監視やフォールトトレラント機能を持ち、大規模アプリケーションをサポートできるものとする。

米国のECPは、現在の20PFlopsシステムの50倍のアプリケーション性能を目指す。実アプリの性能が重要なことは中国も同じであるが、中国の次世代機はピーク演算性能1ExaFlopsがターゲットのようである。

エクサスケールマシンの仕様。電力効率は30GFlops/W

アプリケーション開発では、メッシュ、非構造メッシュ、メッシュフリー、有限要素法、グラフコンピューティングなどの共通的に使用されるキーテクノロジを開発する。そして、数値原子炉、数値航空機、数値地球、数値エンジンというデモアプリケーションを開発する。

数値原子炉、数値航空機、数値地球、数値エンジンというデモアプリケーションを開発する

HPC環境の構築と言うタスクに関しては、CNGridのアップグレードとシステムレベルのソフトウェアを開発で、国家レベルのHPC環境を構築する。CNGridは、計算能力が500PFlops以上、ストレージは500PB以上、アプリケーションソフトウェアとツールは500種以上とし、5000チーム以上のユーザをサポートすることを目標としているという。

HPC環境構築に関しては、500PFlopsの計算、500PBのストレージリソースで500アプリケーションを動かし、5000ユーザをサポートする