1位、2位を米国勢が占めたTOP500

52回目となる2018年11月版のTOP500では米国のスパコン「Summit」が1位、「Sierra」が2位となり、中国の「太湖之光」は3位となった。

2018年6月版のTOP500ではSummitは2,282,544コアであったが、今回は2,397,824コアと若干増えている。そして、Rmaxは122,300TFlopsから143,500TFlopsとなっており、コア数の増加以上に性能アップしている。また、Sierraは1,572,480コアでコア数は変わっていないが、Rmaxは71,610から94,640TFlopsと32%向上し、太湖之光を抜いて2位に躍進している。

なお、以下の図で黄色になっている欄は前回に比べて更新されているという印で、1位のSummitはコア数が多少増えているのでコア数の欄が黄色になっている。2位のSierraはコア数に変化はないが、性能は上がっているので、性能と電力欄が黄色になっている。そして、8位のSuperMUC-NGは完全に新規のシステムなので、全部の欄が黄色になっている。

  • TOP500の上位システムの発表

    TOP500の上位10システムの発表。立って説明しているのが、TOP500主催者の1人であるErick Strohmaier氏。着席しているのが、左からMartin Meuer氏、Horst Simon氏、Green500担当のWu Feng氏、Jack Dongarra氏

SummitとSierraは、前回はまだ、十分なチューニングを行う時間がなかったが、今回は、GPUの使い方などを改善して性能を上げたものと思われる。

3位は中国の太湖之光、4位は中国の天河-2A、5位はスイスのPiz Daint、6位は米国のTrinityで、日本のABCIは7位ということになった。8位はドイツの新システムのSuperMUC-NG、9位はTitan、10位はSequoiaと続いている。なお、日本のOakforest-PACSは14位、京コンピュータは18位である。

そして、TOP500の1位~3位とヨーロッパ1位が表彰された。アジア1位の太湖之光は全体3位で表彰されているので、個別の表彰は省かれている。

  • Summitチームへの賞状の授与

    2018年6月版(前回)に引き続き1位となったSummitチームへの賞状の授与。左から2人目がORNLの所長のThomas Zacharia氏、隣がエネルギー省次官のPaul Dabbar氏、そしてメーカーのIBMとNVIDIAの関係者

TOP500ではHPL性能だけを競うTOP500と並んで、性能/電力を競うGreen500と疎行列の係数を持つ巨大連立1次方程式を解くHPCGも並べて公表しており、TOP500だけでは偏った評価であるという批判に応えている。

電力効率を競うGreen500

今回のGreen500では、1位は前回に引き続き、理化学研究所(理研)の「Shoubu(菖蒲) system B」が獲得した。

  • Green500上位10システムの発表

    Green500上位10システムの発表。性能/電力値に、性能を下げて電力を大きく減らす最適化を行ったシステムには*がつけられている。ABCIの14.2GFlops/Wは最適化を行った場合の値である

菖蒲 system Bは、前回は794,400コアで857.6TFlopsであったが、この性能では今回はTOP500に入れず足切りにあってしまうので、953,280コアにアップグレードして性能を1,063.3TFlopsに引き上げている。それにより電力効率は多少低下して17.604GFlops/Wとなったが以前に引き続き1位をキープしている。

  • Green500の1位の表彰

    Green500の1位の表彰。左端はTOP500主催者側のHorst Simon氏で、その隣がExaScalarの鳥居氏、今回のシステムのチューニングを行った坂本氏、理研の情報システム部の姫野氏。右端は、Green500担当のFu Feng教授

前回は2位、3位にもExaScalarのマシンが並んでいたが、今回は足切りの影響か姿を消し、NVIDIAのDGX Saturn V Voltaが15.113GFlops/Wで2位となっている。そして、3位にはTOP500で1位のSummitが入っている。この規模でGreen500の3位は、堂々たるものである。

また、今回のGreen500リストでは、産総研のABCIが4位に入った。TOP500の7位という大規模システムでGreen500の4位は立派なものである。しかし、今回の測定は電源電圧やクロックを最適化してHPL性能は168.59PFlops、消費電力は1168.8kWで、性能/電力14.432GFlops/Wを達成したものである。

そして、Sierraが12.723GFlops/Wで6位にランクインされているのが注目される。今後は、超巨大システムでもSummitやSierraを超える高い性能/電力が要求されることになると予想される。

巨大疎行列の連立1次方程式を解くHPCG

興味深いのがHPCGのランキングである。TOP500のHPLもHPCGもどちらも巨大連立1次方程式を解く性能を競うものであるが、HPLは方程式の係数が非セロの密行列であるのに対して、HPCGはHPLよりも未知数の数は大きいが、係数の大部分がゼロの疎行列である点が異なる。

HPLでは未知数を順番に求めていくような方法が使われるが、巨大疎行列の場合は、この方法では効率が悪く、未知数の値の初期値を代入して、誤差を求め、それを小さくするように未知数の値を修正していくという方法が用いられる。

このため、HPLでは計算の回数が多く、Flops演算性能が重要であるが、HPCGの場合は疎行列であるので、メモリのアクセス性能が重要になる。

1位はHPCG 2925.75TFlopsのSummitで、Sierraが1795.67TFlopsで2位となり、初めてHPCG性能が1PFlopsを超えた。しかし、この性能はTFlops値で比べるとSummitではHPL性能の2.04%、Sierraでは1.90%であり、演算器は余っているがメモリアクセスがネックとなっていることを示している。

  • HPCGのトップ10システムの発表

    HPCGのトップ10システムの発表。今回、初めてSummitとSierraのHPCG性能が1PFlopsを超えた

注目されるのは京コンピュータが3位にランクされている点である。特に、京コンピュータではHPLとの性能比が5.7%という高い値になっている。これはメモリシステムと演算器のバランスが約0.5Byte/Flopという高い値になっていることが効いている。

なお、HPCGの1位はSummitであるが、この表彰はTOP500の1位の表彰と合わせて行われ、HPCGだけの表彰は行われなかった。

最近の巨大問題は未知数の数が膨大であるが、ある未知数影響を与える他の未知数は近傍にある未知数だけで、その数は比較的小さいというケースが多く、HPCGの方が現実の問題に近いといわれており、HPCG性能が注目されてきている。

この点で、京コンピュータはバランスの取れた設計であると評価が高まっており、SummitとSierraがHPCGで1位と2位となったように、メモリ性能を重視したバランスの取れたスパコンが増えてきている。

ただし、HPCGはピーク性能に比べて1~2%の性能になってしまい、メーカーが言いたがらないという問題があり、普及するかどうかはわからない。