COOL Chips 24で「Codesign and System of the Supercomputer “Fugaku”」と題する基調講演が行われた。

講演者は次の図1のスライドに見られるように、富岳の開発を行った理研R-CCSのアーキテクチャ開発チームのチームリーダの佐藤三久氏である。氏は富岳を開発したFLAGSHIP2020プロジェクトの副プロジェクトリーダであり、また、理研R-CCSの副所長でもある。そして、筑波大学の教授でもある。

Computer Scienceの分野では我が国を代表する偉い先生であるが、親しみを込めて、学会や業界では漢字の名前を音読みして「さんきゅう」さんと呼ぶ人も多い。富岳がどのように開発されたのかを語るには最適な講演者であると思う。

なお、佐藤先生の基調講演では時間が足りず、最後の方のスライドは説明なしに飛ばしてしまわれたが、この連載では予稿集のほぼ全部のスライドを引用し、(筆者の独断に基づく)説明を加えている。

  • 富岳

    図1 佐藤先生の「富岳のコデザインとシステム」の基調講演のタイトルスライド (この連載のすべての図は、佐藤先生の基調講演の発表スライドのコピーである

図2は神戸の理研計算科学センター(Riken-Center for Computer Science:R-CCS)に設置された富岳スパコンの写真で、青い箱がラックと呼ばれる構成単位である。富岳では、全部で432ラックを使っている。

倍精度(FP64)のピーク演算性能はおおよそ0.5ExaFlopsである。単精度(FP32)の場合は約1ExaFlops、半精度(FP16)のAIの学習計算では約2ExaFlopsの性能である。

  • 富岳

    図2 神戸のR-CCSに設置された富岳スパコン

図3に富岳を開発するFLAGSHIP2020プロジェクトの年表を示す。2014年にプロジェクトが開始され、2019年の3月にスパコンの正式名称が「富岳」に決定した。そして、2019年8月に、京コンピュータの稼働を停止し、撤去を開始した。2020年の富岳の設置完了の直前まで京コンピュータも稼働させられるはずであるが、R-CCSではスペースが無く、京コンピュータの設置場所に富岳を置かざるを得ないので、1年あまり使えるスパコンが無い状態になった。米国のスパコンセンターのように床面積に余裕があれば、このスパコン無し期間を短縮できたはずである。

そして、富岳の出荷が完了したのが2020年5月で、2020年6月にはTop500、HPCG、Graph500、HPL-AIで1位を獲得した。なお、2019年11月のGreen500 1位は、フルシステムではなく、764ノードという小規模のプロトタイプ機での授賞である。

それから、2020年1月から早期アクセスプログラムを開始し、COVID-19の医薬の解析や飛沫感染のシミュレーションなどに活躍している。

そして、2020年11月にも、前回に引き続きTop500、HPCG、Graph500、HPL-AIで1位を獲得し、2021年3月9日から正式運用を開始している。

  • 富岳

    図3 富岳を開発するFLAGSHIP2020プロジェクトの年表。2014年にプロジェクトが開始され2020年6月にTop500で1位となった。そして、2021年3月9日から正式運用を開始している

次の図4は2020年6月のTop500、HPCG、HPL-AI、Graph500の性能をまとめたもので、これらの4ベンチマークすべて1位は富岳である。3番目の欄は性能を示し、次の2nd以降は2位のスパコン名と性能を示す。そして、最後の欄は、1位の富岳の性能が、2位のスパコンの性能の何倍であるかを示している。

Top500、HPCG、HPL-AIベンチマークでは米国のSummitが2位であるが、富岳の性能は2.58倍~4.57倍となっている。Graph500の2位は中国の太湖の光で、それに比べて富岳は2.99倍の性能となっている。

  • 富岳

    図4 Top500、HPCG、HPL-AI、Graph500の富岳の性能と2位のスパコンの性能との比較。2位と比べて富岳は2~4倍性能が高い

図5は図4から半年後の2020年11月の4ベンチマークの性能をまとめたものである。5番目の欄の( )付きの数値は2020年6月のもので、2番目の欄が2020年11月の性能である。

これらを比べると、Top500(LINPACK)の性能は415.5PFlopsから432.01PFlops、HPCGは13.4PFlopsから16.00PFlops、HPL-AIは1.42EFFlopsから2.00EFlops、Graph500は70.98Ttepsから102.95Ttepsと6.4%~45%性能が向上している。その原因は2020年6月は、計算ノードが足りなかったり、クロックが低かったりということで、フルシステムになっていなかったのであるが、2020年11月にはフルシステムが使えるようになったことと、アルゴリズムが改善され、より短い時間で計算できるようになったからである。

これに伴い、2位のシステムとの性能比も3.0~5.5倍に開いた。

  • 富岳

    図5 2020年11月の結果。6月に比べて6.4%~45%性能が向上している

文部科学省は富岳を、当初予定より約1年前倒ししてCOVID-19との戦いに使用するというプログラムを開始した。このプログラムで、すでに認可されている2000種の薬品がCOVID-19と結合するかをシミュレーションしてCOVID-19に効きそうな薬品候補の絞り込みを行ったり、TVで良く流されていた飛沫の飛び方のシミュレーションを行い、飛沫感染を減らすマスクの使い方や飛沫を防ぐアクリル板の設置などの感染対策の有効性の評価が行われた。

  • 富岳

    図6 文科省は富岳の稼働を前倒しして、COVID-19との戦いのプロジェクトに使用することを決定

ここまでは佐藤先生の前説で、次回以降が基調講演の本題である。

(次回に続く)