HPC業界の15年間を振り返る

米Indiana大学のThomas Sterling教授は、Donald Becker氏らとともに1994年にBeowulfクラスタを開発したことで知られるHPC界の名物教授である。1994年当時は、スパコンと言えばベクトル型の専用機が全盛であったが、Beowulfはx86ベースの52台のPCをEthernetで接続したクラスタでHPCを実行させ、圧倒的に高いコストパフォーマンスが得られることを示した。

ISCで閉会式直前の最後のプログラムとして行われるSterling教授の年次総括は恒例で、今年で15回目になるという。

  • Indiana大学のThomas Sterling教授

    ISC18の大トリとなる年次総括の基調講演を行うIndiana大学のThomas Sterling教授

この総括は、Sterling教授の個人的な見方を述べるものであり、意図的ではないがバイアスがかかっていることは避けられない。どちらかと言えばハードウェアが中心であるが、ソフトウェアもカバーしている。そして、この1年間の総括だけでなく、この15年間を振り返りがなされたほか、将来のトレンドやその意味するところについても述べられた。

  • Sterling教授の総括基調講演

    この総括基調講演は15年目で、ISCの伝統になっている。HPC業界の、この1年をSterling教授がどう見ているのかを述べるもので、意図的では無いが、当然、バイアスがかかっている(この連載のすべての図は、Sterling教授の基調講演での発表スライドを撮影したものである)

「15年は非常に長い期間で、私が果実の害虫であるミバエであれば、120世代に相当する。しかし、私は本当はミバエではない。人間の120世代は4000年くらいであるが、4000年前にはマンモスが絶滅し、ミノアの首都クノッソスが築かれ、ストーンヘンジが完成したという位、昔の話である」。この辺の15年という説明は、Sterling先生一流のジョークである。

  • 15年は非常に長い期間

    15年は非常に長い期間で、ミバエであれば120世代である。人間の120世代は4000年前で、マンモスの絶滅とかクノッソスの王宮やストーンヘンジが完成したとかいう時代である

この15年を振り返ると、2006年にはマルチコアでPetaFlopsを目指すという動きが顕著になり、2008年にはそれが実現した。そして、2010年にはExaFlopsという目標が掲げられ、その開発に備えた動きが始まった。

2012年には100万コアのスパコンが登場し、2013年にはExaFlopsまでの道のりの半分まで来たと言われたが、ムーアの法則のスローダウンや消費電力の問題から、2020年のExaFlopsの実現は難しいという見方が広がった。

そして、2016年には100PFlops時代に入り、2017年はExascaleのプランを再構築する年になり、2018年は、また、興奮させられる時代になって来たとする。

  • 2004年からのHPC分野での各年の主要なテーマ

    2004年からのHPC分野での各年の主要なテーマ

HPC業界の2018年のハイライト

2018年のハイライトであるが、以下の7つが挙げられた。

  1. 米国のSummitが稼働し、Top500の首位になった
  2. 中国がTop500スパコンの台数を増やし、米国との差を広げた
  3. Armアーキテクチャのスパコンの開発競争が始まった
  4. Exascaleの開発には拍車が掛かったが、まだ、そこには到達していない
  5. マシンラーニングが多くのHPCの位置づけの見直しを迫っている
  6. 量子コンピューティングの研究が加速している
  7. ISCの出席者が、今年年も前年を上回った
  • 2018年のハイライトは米国がTop500の首位に返り咲いたこと

    2018年のハイライトは、Summitが稼働し、米国がTop500の首位に返り咲いたこと。しかし、Top500に含まれるシステム数では首位の中国が差を広げた

Summitは米国のエネルギー省のCORAL-1マシンで、Oak Ridge国立研究所(ORNL)に設置された。製造したのはIBMとNVIDIA(Top500の表彰では、インタコネクトを供給したMellanoxも入っていたが、Sterling教授は、Mellanoxは入れていない)である。

ピーク演算性能は200PFlopsで、HPLのRmax性能は122.3PFlopsである。POWER9 CPUを9,216個とTesla V100 GPUを27,648個使っている。設置面積は8,000平方フィート(約520平方メ―トル)を超える。消費電力は15MW。

  • Top500の1位になった米国のSummitスパコン

    Top500の1位になった米国のSummitスパコン。ピーク200PFlopsでHPL性能は122.3PFlops

Summitは本当に大きなマシンであるが、それはHPL性能だけが高いマシンではなく、それとはまったく異なるマシンである。Summitは、正しいマシンが正しい時期に正しい人の手にゆだねられたというべき存在だとする。

Summitには先端テクノロジが利用されている。ORNLはこの種のアクセラレータ付きのマシンの使い方を、ほぼ5年の間のTitanの運用で、経験を積んできたため、Summitを活用して実際の問題を処理するための運用を行う準備はすでに整っているといえる。

過去に、Sterling教授は、CPU+GPUのような構成はうまく行かないと述べていたのだが、それは間違いで、Summitではそのような極端なヘテロ構成が鍵となった。またIntelとCrayがアルゴンヌ国立研究所用に構築しようとしているAuroraは延期されて「Aurora-21」に計画変更になった。Sterling教授が、Auroraについて以前に述べたことは間違いであったと、発言の間違いを訂正した。

  • SummitはHPL性能だけが高いマシンではない

    SummitはHPL性能だけが高いマシンではなく、正しいマシンが正しい人の手に渡ったというべきである。ORNLはCPU+GPUマシンの使い方はTitanで経験を積んでおり、Summitを使う準備は出来ている

(次回は8月8日に掲載します)