中国のExascaleシステムの開発計画

中国のExascaleシステム開発のロードマップは、NUDT(National University of Defense Technology:国防科技大学)のLu Kai氏が発表する予定であったが、突然の病気で、同じNUDTのRuibo Wang氏が発表することになった。

  • 中国のExascaleシステムへの道を説明するNUDTのRuibo Wang氏

    中国のExascaleシステムへの道を説明するNUDTのRuibo Wang氏

中国は1990年からHPCを推進する5ヵ年計画を継続してきた。2001年から2005年には第10次5ヵ年計画でTFlops級のハードウェアとソフトウェアを開発し、2006年から2010年の第11次5ヵ年計画ではPFlops級のスパコンとグリッドコンピューティング環境を開発した。

  • 中国は863プログラムで1990年代からHPCを推進してきている

    中国は863プログラムで1990年代からHPCを推進してきている

2011年から2015年の第12次5ヵ年計画では100PFlops級のスパコンとクラウドコンピューティング環境の構築をターゲットとし、世界トップとなったTianhe-2(天河2)とSunway TaifuLight(神威 太湖之光)を開発した。2016年から2020年にかけての第13次5か年計画では、ExaFlopsスパコンの鍵となる技術を開発することが目標である。

  • 中国のスパコン開発ロードマップ

    2011~2015年の第12次5ヵ年計画では100PFlopsのスパコンとクラウドコンピューティングの実現が目標であり、Tianhe-2とSunway TaifuLightを開発した。2016~2020+年の第13次5ヵ年計画ではEFlopsスパコンのキーテクノロジを確立する

中国のHPCベンダとしては、天河2Aを開発したNUDT(国防科技大学)、神威 太湖之光を開発したNational Research Center of Parallel Computer Engineering and Technology(NRCPC)、そして私企業のDawning(曙光:Sugon)、Lenovoなどがある。NUDTとNRCPCはアクセラレータやメニーコアCPUを自主開発している。

DawningやLenovoはHPC以外の通常のサーバやPCなども開発、製造している。

  • 中国のHPCベンダ

    中国のHPCベンダとしては、政府の開発機関であるNUDTとNRCPCとDawning、Lenovoなどの私企業がある

NUDTは2009年に1.2PFlopsのTianhe-1を開発し、2010年にTianhe-1A、2013年に55PFlopsのTanhe-2を開発しTop500の1位になった。そして、2017年にはピーク100PFlopsのTianhe-2Aを開発した。

NUDTはInfiniBandと同程度の性能のインタコネクトを自主開発している。また、Tianhe-2AではIntelのXeon Phiが輸入できなくなったため、Matrix-2000というアクセラレータを自主開発している。

  • NUDTはTianheシリーズを開発してきた

    NUDTはTianhe-1、-1A、Tianhe-2、-2Aを開発してきた。NUDTはインタコネクトを自主開発しており、Tianhe-2AではMatrix-2000アクセラレータも自主開発した

NRCPCは独自のCPUとインタコネクトを開発してSunway TaifuLightを作っており、主要部品のテクノロジは自主開発している。

  • NRCPCはSunwayシリーズを開発してきた

    NRCPCは2010年にSunway BlueLight、2016年にSunway TaifuLightを開発した。TaifuLightは、今回、Summitに抜かれるまでTop500の1位であったスパコンである

Dawningはx86互換のプロセサを使用しており、1998年には100GFlopsのクラスタスパコンのDawning 2000、2000年には400GFlopsのDawning 3000、2008年には233TFlopsのDawning 5000Aを開発した。Dawning 5000Aは当時のTop500で10位にランクされている。

  • Dawning(Sugon)はx86互換のCPUを使うスパコンを作っている

    Dawning(Sugon)はx86互換のCPUを使うスパコンを作っている。1998年には100GFlopsのDawning 2000を開発。そして、2008年のDawning 5000AはTop500の10位にランクされた

発表者はNUDTの人であり、NUDTの最近の開発であるTianhe-2Aについて詳しく発表を行った。

Tianhe-2はIntelのXeon CPUとXeon Phiアクセラレータを使っていた。Tianhe-2AはTianhe-2のCPUを若干追加して35,854個とし、Xeon Phiは5,696個に減らし、35,848個のMatrix 2000アクセラレータを追加するというアップグレードを行って、ピーク演算性能を100PFlopsに引き上げている。

インタコネクトは自主開発のTH Express-2を使っている。メモリ総量は3PBで、これに加えて19PBのストレージを持っている。

キャビネット数は~189で、消費電力は20MWである。冷却は、キャビネットを繋いで、その中を空気を循環させて冷却する方式で、空気のループの中に冷却コイルを設置して循環する空気を冷却する方式をとっている。

  • NUDTの最新作のTianhe-2Aの諸元

    NUDTの最新作のTianhe-2Aの諸元。35584個のXeon CPU、35584個のMatrix-2000 アクセラレータと5696個のXeon Phiを使い、ピーク演算性能は100.68PFlops。~189キャビネットで構成され,消費電力は20MW

Tianhe-2Aでの大きな拡張はMaxrix-2000アクセラレータの追加である。Matrix-2000は128コアで1.2GHzのクロックで2.4567TFlopsと書かれている。この数字から計算すると、各コアは16Flop/Cycleとなる。256bitのベクトル演算を行うと書かれているので、この演算器を2個持っているようである。

Matrix-2000チップの消費電力は240Wで、電力効率は約10GFlops/Wとなる。ただし、この値はピークFlopsをチップの消費電力で割ったものであり、HPL性能をシステムの消費電力で割るGreen500の値は半分かそれ以下になるのではないかと思われる。

また、Tianhe-2Aではインタコネクトのデータ伝送速度を10Gbit/sから14Gbit/sに引き上げている。ただし、PeakFlopsはほぼ2倍になっているので、Flopsあたりのデータ伝送バンド幅は低下していることになる。

  • Matrix-2000アクセラレータの諸元

    Matrix-2000は128コアを集積し、1.2GHzクロックで2.4576TFlopsの性能を持つ。消費電力は240W。計算ノードのピーク演算性能は5.34TFlops。また、Tianhe-2Aではインタコネクトを10Gから14Gに高速化している。右側の写真の3個のLSIは、1番上がMatrix-2000アクセラレータで、下の2つはGalaxy NRCとGalaxy NICと書かれており、インタコネクトのLSIと見られる

(次回は7月27日に掲載します)