理化学研究所(理研)、東京科学大学(Science Tokyo)、フィックスターズ、日本電信電話(NTT)、富士通で構成される共同研究グループは11月18日、大規模グラフ解析に関するスーパーコンピュータ(スパコン)国際性能ランキング「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、スパコン「富岳」を用いてグラフ解析性能として約204TeraTEPSを達成し、10期連続での世界第1位を獲得したことを発表した。

  • スパコン「富岳」

    スパコン「富岳」 (提供:理化学研究所)

大規模グラフ解析の性能は大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標とされ、今回の性能は富岳全体の約95.7%にあたる15万2064ノードを用いて、約8.8兆個の頂点と140.7兆個の枝から構成される大規模グラフに対する幅優先探索問題を平均0.69秒で解いた結果によるもの。前回(2024年5月)の結果から、さらに独自開発の省メモリ化技術を用いることで、従来以上の大規模グラフ処理に成功したとするほか、乱数による性能変動の抑制を目的に、良い性能を与える乱数シード値の探索も導入によって、38.038TeraTEPSの性能向上を果たし、世界で初めて200TeraTEPS超えを達成したという。

この技術の詳細ならびに富岳の評価結果については、11月17日~22日(米国時間)にかけて米国ジョージア州アトランタのジョージア・ワールド・コングレス・センターおよびオンラインで開催されているHPCに関する国際会議「SC24」にて論文発表される予定だという。

なお、これまで研究グループが開発したスパコン上で大規模なグラフを高速に解析できるソフトウェア技術は以下の通り。

  1. 複数のノード間におけるグラフデータの効率的な分割および圧縮
  2. 冗長なグラフ探索を削減するアルゴリズム
  3. BFSの結果に影響を与えずに不要な頂点を削除する前処理
  4. スパコンの大規模ネットワークにおける通信性能の最適化
  5. 探索アルゴリズムの動作を制御するパラメータの自動チューニング
  6. 乱数による性能変動を緩和するシード値探索

研究グループでは、Graph500のBFS部門における第1位獲得は、富岳が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる富岳の優れた汎用性を示すものであると説明しており、今後も前処理を通じた後続の計算の負荷低減やデータの圧縮の検討を継続させていくことで、今回の測定で得たデータを基に性能改善を加速させていくとしている。