スーパーコンピュータ(スパコン)のランキングで最も有名なTOP500はLINPACKという多次元の連立一次方程式を解く場合の性能を競うものであるが、LINPACKでは、高い浮動小数点演算の性能が必要とされるが、メモリバンド幅や計算ノード間をつなぐネットワークの性能は、それほど高い必要はない。このため、LINPACKは偏った性能評価であるという批判がある。

このため、より多面的にスパコンの性能を評価する目的で作られたのが、HPC Challenge(HPCC)というベンチマークである。HPCCはLINPACKとほぼ同等のHPLというプログラム、行列積を計算するDGEMM、メモリバンド幅を測るSTREAM、行列の転置を行うPTRANS、ランダムにメモリをアクセスするRandomAccess、そしてフーリエ変換を行うFFT、そして、通信バンド幅などを測る一連のプログラムからなっている。

HPCCによる性能測定箇所を示す図

この図のようにマルチプロセサ構成のスパコンでは、プロセサの内部にあるレジスタからキャッシュ、ローカルメモリ、リモートメモリを経由してディスクなどのIOに繋がるという構成になっている。また、他のプロセサとの通信は、キャッシュ、ローカルメモリを経由してグローバルメモリでデータを入れ、それを他のプロセサが自分のローカルメモリ、キャッシュを経由してレジスタに読み込むことになる。

LINPACKやHPLは、この第1階層の性能だけを測るプログラムであるが、STREAMは第2階層、RandomAccessとFFTはメモリは第3階層の性能を中心に測定している。

このように多くの性質の異なるプログラムが含まれているので多面的にスパコンの性能が評価できるのであるが、それぞれ異なる部分の性能を評価するHPLの性能とSTREAM、RandomAccess、FFTの性能を1つの尺度に換算して総合1位を決めることはできない。スパコンを導入しようとするユーザにとっては、自分のところではどのようなプログラムの性能が重要かは分かっているので、HPCCのそれぞれのプログラムでの測定値を見ることは役に立つが、HPCCは、マスコミなどで世界一と報道するような用途では都合が悪い。

しかし、ある程度のランキングが出来ないと使いにくいことも事実であり、HPCCもHPL、STREAM、RandomAccess、FFTの4つのプログラムを主要性能評価として選び、それぞれのプログラムでの1位から3位のシステムを発表している。

HPLはLINPACKと同じ処理であるが、HPCCでは全部のプログラムを同一のシステム構成で測定することが義務付けられており、HPL向けに構成を最適化すると、他のプログラムでの性能が下がってしまうということが起こり、これらの4種のプログラムでバランスしたシステム構成を作って測定を行う必要がある。ということで最適なシステム構成を探して性能測定を行うのは、LINPACKだけの測定よりも手間が掛るし、HPLの性能はLINPACKの性能より低くなることになる。

2005年から始まったHPCCの4種のプログラムの性能のランキングでは、初回の2005年と2回目の2006年は米ローレンスリバモア国立研究所のBlueGene/Lが4種目の制覇を果たしたが、2007年以降は4種目を制覇したシステムは出ていなかった。

それを、今回、「京」コンピュータが5年ぶりに4種目の完全制覇を果たした。

HPLのランキング

HPLでは、2009年、2010年と1位のオークリッジ国立研究所のJaguarのスコアを約40%上回り、「京」が1位となった。

STREAMのランキング

STREAMも2009年、2010年と1位であったJaguarの2倍強のスコアを出して「京」が1位となった。

RandomAccessのランキング

RandomAccessでは昨年1位のローレンスリバモア国立研究所のBlueGene/Pを僅かではあるが凌いで「京」が1位となっている。

FFTのランキング

FFTは昨年、海洋研究開発機構の地球シミュレータ2がトップとなったが、今年は、「京」が3倍近いスコアを叩き出してダントツの1位である。

表彰状を受け取る理化学研究所(理研)の関係者

HPCCは知名度という点ではTop500に劣るが、多面的な性能評価であるHPCCで4種目での完勝はTop500の1位よりも価値のある成果であると言える。