Simon氏の見るTOP500の将来

続いて、Horst Simon氏が登壇し、今後のTOP500ベンチマークの方向性について述べた。

次の図は、横軸が国のGDPで縦軸は2017年6月のリストに載ったスパコンの国別の台数である。図中の斜めの破線より上は、GDPの割にはスパコン数が多い国で、破線より下の国はGDPの割にはスパコン数が少ない国である。

個々の国によって、スパコンへの支出のGDP比率が異なるが、全体として言えるのは、GDPが大きい国はGDP比率よりもスパコン台数が多く、GDPが少ない国は生活するのに精いっぱいでスパコンに回せるお金があまり無く、GDPの割にはスパコンが少ないという風に見える。

  • G20各国のGDP(横軸)とTOP500スパコン台数のプロット

    G20各国のGDP(横軸)とTOP500スパコン台数のプロット。GDPの大きな国は、GDP比率より多くのスパコンを持つ傾向がある (今回の図は、Horst Simon氏の講演スライドを筆者が撮影したものである)

Dongarra教授は、HPLは最近のアプリケーションの特性とはズレて来ているのが問題と指摘しており、ズレを見ようというのが次のプロットである。□はTOP500の1位のHPL性能で、〇はGordon Bell賞を取った論文のアプリケーション性能である。

マクロにみると、HPL性能とGordon Bell論文のアプリケーション性能は高い相関があるように見える。より詳細にみると、最近ではアプリケーション性能は、HPL性能の20%~30%程度のケースが多く、ズレはそれほど明確ではない。

一方、Gordon Bellの論文は演算性能が高い方が評価されるので、HPLに比べて大幅に性能が低い論文は出ない。したがって、Gordon Bellの論文がアプリケーションの代表とは言えないという面もあり、このプロットだけで、代表的なアプリケーションの性能の伸びがHPL性能の伸びと一致しているとは言い切れない。

  • TOP500 1位の性能とGordon Bell賞の性能の推移

    TOP500 1位のシステムのHPL性能(□)の推移とGordon Bell賞を受賞した論文のアプリケーション性能(〇)の推移

HPLがスパコンの一面の性能しか評価していないことはよく認識されていて、別の側面の性能を測定するいろいろなベンチマークが開発されている。消費電力を考慮に入れたGreen500、グラフ処理性能を見るGraph500、疎行列の処理性能を見るHPCG、ストレージシステムのIO性能を見るIO-500などがある。この中で、Green500とHPCGは、すでにTOP500に組み込まれている。

  • ここに画像の説明が入ります

    HPLはスパコン性能の一面だけしか評価していない。このため、Green500、Graph500、IO-500、HPCGなどが開発されている

マシンラーニングの重要性は急速に高まっており、マシンラーニングを主要な用途とするスパコンシステムも設置され始めている。

ディープラーニングの計算は行列積の計算であり、マシンラーニング用に低精度計算を追加したHPLで良いのではないかという考えもある。

マシンラーニング向けのベンチマークについては、2018年春にワークショップを開いてコミュニティの意見を聞く。そして、2018年6月のISC18のBoFでさらに議論して、11月のSC18でベンチマーク案を発表することを考えているという。

  • マシンラーニングのベンチマークの開発を計画

    マシンラーニングの重要性の高まりから、マシンラーニングのベンチマークの開発を計画している。次はML500か?

科学技術計算でもスパコンではなく、クラウドを使うケースが増えている。しかし、TOP500にリストされているのは、Amazon AWSの438位のシステムだけである。

クラウドとHPCシステムを比較した研究は少数しかない。Jacksonらの論文ではクラウドはHPCシステムと比較して性能、価格で競争力がないと結論づけている。MohammadiとBazhirovの論文はいくつかのクラウドでHPCアプリを動かして比較したものであるが、1000コア(8TFlops)程度の規模までの調査であり、TOP500にリストされる規模のシステムは調べていない。

クラウドとHPCではアプリケーションの実行モデルが大きく異なる。もし、クラウド上ではHPLの実行がうまくスケールしないとすれば、実アプリケーションがスケールすることは期待できない。

  • クラウドとHPCではアプリケーションの使用モデルが大きく異なる

    クラウドとHPCではアプリケーションの使用モデルが大きく異なる。クラウドでのHPCアプリケーションの実行に関する研究は非常に少なく、まだ結論はでていないが、クラウドはスパコンの代わりにはならないという感触である

将来を見渡すと、クラウド、マシンラーニング、量子コンピューティング、ニューロモルフィックコンピューティング、ポストムーアのデジタルコンピューティングなどのいろいろな処理方法が提案されている。その意味で、HPCは基本テクノロジの移行期に差し掛かっており、スパコン初期よりもより大きな革命的な変化が起こるかもしれない。

  • スーパーコンピュータは基本テクノロジの変革期に差し掛かっている

    マシンラーニング、量子コンピュータ、ニューロコンピュータなど、これまでと異なるシステムが出てきており、スーパーコンピュータは基本テクノロジの変革期に差し掛かっている

まとめであるが、25年間のTOP500の推移は驚異的であるが、これまでのような一貫性のある驚くべき成長は終わりに近づいている。25年後のスパコンはどのようになっており、どのようにベンチマークするのであろうか?

  • 2042年のSC42でお会いしましょう

    これまで25年のTOP500の発展は驚異的であったが、25年後のスパコンはどうなり、どのようにベンチマークを行うようになるのか?。最後は2042年のSC42でお会いしましょうと書かれている