Simon氏の見るTOP500の将来
続いて、Horst Simon氏が登壇し、今後のTOP500ベンチマークの方向性について述べた。
次の図は、横軸が国のGDPで縦軸は2017年6月のリストに載ったスパコンの国別の台数である。図中の斜めの破線より上は、GDPの割にはスパコン数が多い国で、破線より下の国はGDPの割にはスパコン数が少ない国である。
個々の国によって、スパコンへの支出のGDP比率が異なるが、全体として言えるのは、GDPが大きい国はGDP比率よりもスパコン台数が多く、GDPが少ない国は生活するのに精いっぱいでスパコンに回せるお金があまり無く、GDPの割にはスパコンが少ないという風に見える。
Dongarra教授は、HPLは最近のアプリケーションの特性とはズレて来ているのが問題と指摘しており、ズレを見ようというのが次のプロットである。□はTOP500の1位のHPL性能で、〇はGordon Bell賞を取った論文のアプリケーション性能である。
マクロにみると、HPL性能とGordon Bell論文のアプリケーション性能は高い相関があるように見える。より詳細にみると、最近ではアプリケーション性能は、HPL性能の20%~30%程度のケースが多く、ズレはそれほど明確ではない。
一方、Gordon Bellの論文は演算性能が高い方が評価されるので、HPLに比べて大幅に性能が低い論文は出ない。したがって、Gordon Bellの論文がアプリケーションの代表とは言えないという面もあり、このプロットだけで、代表的なアプリケーションの性能の伸びがHPL性能の伸びと一致しているとは言い切れない。
HPLがスパコンの一面の性能しか評価していないことはよく認識されていて、別の側面の性能を測定するいろいろなベンチマークが開発されている。消費電力を考慮に入れたGreen500、グラフ処理性能を見るGraph500、疎行列の処理性能を見るHPCG、ストレージシステムのIO性能を見るIO-500などがある。この中で、Green500とHPCGは、すでにTOP500に組み込まれている。
マシンラーニングの重要性は急速に高まっており、マシンラーニングを主要な用途とするスパコンシステムも設置され始めている。
ディープラーニングの計算は行列積の計算であり、マシンラーニング用に低精度計算を追加したHPLで良いのではないかという考えもある。
マシンラーニング向けのベンチマークについては、2018年春にワークショップを開いてコミュニティの意見を聞く。そして、2018年6月のISC18のBoFでさらに議論して、11月のSC18でベンチマーク案を発表することを考えているという。
科学技術計算でもスパコンではなく、クラウドを使うケースが増えている。しかし、TOP500にリストされているのは、Amazon AWSの438位のシステムだけである。
クラウドとHPCシステムを比較した研究は少数しかない。Jacksonらの論文ではクラウドはHPCシステムと比較して性能、価格で競争力がないと結論づけている。MohammadiとBazhirovの論文はいくつかのクラウドでHPCアプリを動かして比較したものであるが、1000コア(8TFlops)程度の規模までの調査であり、TOP500にリストされる規模のシステムは調べていない。
クラウドとHPCではアプリケーションの実行モデルが大きく異なる。もし、クラウド上ではHPLの実行がうまくスケールしないとすれば、実アプリケーションがスケールすることは期待できない。
将来を見渡すと、クラウド、マシンラーニング、量子コンピューティング、ニューロモルフィックコンピューティング、ポストムーアのデジタルコンピューティングなどのいろいろな処理方法が提案されている。その意味で、HPCは基本テクノロジの移行期に差し掛かっており、スパコン初期よりもより大きな革命的な変化が起こるかもしれない。
まとめであるが、25年間のTOP500の推移は驚異的であるが、これまでのような一貫性のある驚くべき成長は終わりに近づいている。25年後のスパコンはどのようになっており、どのようにベンチマークするのであろうか?