京コンピュータを抜いて演算性能で国内1位となった「Oakforest-PACS」スパコンが、2016年12月1日に正式稼働し、報道陣に公開された。Oakforest-PACSスパコンは東京大学(東大)と筑波大学が共同で調達し、共同で運用するスパコンで、東大の柏キャンパスの最先端共同HPC基盤施設(JCAHPC:Joint Center for Advanced High Performance Computing)に設置されている。
東大の柏キャンパスのスパコンは、初代が「Oakleaf」と柏(Oak)にちなんだ名前が付けられている。一方、筑波大のスパコンは、共同利用センターという側面に加えて並列コンピューティングの研究という側面を持ち、代々、「PACS(Parallel Architecture for Computer Science)」を含む名前を付けている。そこで、今回は共同調達であるので、両者の名前を取り入れて、Oakforest-PACSという名前を付けている。筑波大の朴先生は、Oakforest-PACSで一語であり、くれぐれも途中で切らないようにと念を押していた。
TOP500とHPCG
スパコンの性能ランキングとして一番有名なTOP500は、High Performance Linpack(HPL)というプログラムを実行する性能を測定してランキングを行っている。2016年11月14日に発表されたTOP500スパコンランキングでは、1位~4位は前回から変更が無く、5位にローレンスバークレイ国立研究所のCori、そして6位にOakforest-PACSと2台の大型Xeon Phiスパコンが新たにリストに加わった。
Oakforest-PACSは13.554PFlopsのHPL性能をマークして、世界で6位となった。これは7位となった京コンピュータの10.51PFlopsを上回り、日本国内トップの性能である。
なお、TOP500のリストではピーク性能は24.91PFlopsで、HPL性能はピーク性能の54.4%である。これは低いので、何が問題かとSC16の時にJCAHPCの人に聞いたところ、AVX-512を頻繁に使うと、1.4GHzのクロックでは動かず、ピーク性能が下がってしまうのが問題とのことであった。
IntelのXeon PhiのProduct Briefには、細かい字の注釈で、For High AVX Instruction Frequency, subtract 200MHzと書いてあり、どうもHPLに計算のようにガンガンAVX-512を使うと1.4GHzクロックが1.2GHzに下がるようである。そうすると、ピーク性能は6/7に下がり、正しいピーク比率は7/6の63.5%ということになる。63.5%なら、まあまあというところであろうか。
HPLは巨大な連立一次方程式を解くプログラムである。しかし、最近では未知数の数が1000万個を超えるような計算が行われており、現実の問題と合わないという批判もある。
HPLを補完するため、High Performance Conjugate Gradient(HPCG)というベンチマークプログラムが開発されている。HPLの連立一次方程式は、未知数の係数のほとんどが非ゼロであるが、HPCGの巨大な連立一次方程式は、未知数の数はHPLより多いが、大部分の係数はゼロで非ゼロの係数は少しだけという違いがある。
このように、係数行列が疎行列の場合は、非ゼロの値だけを圧縮して格納するなどの方法が採られるが、密行列に比べてメモリアクセスの仕方が複雑になり、メモリアクセスに時間がかかる。このため、HPCGでは、演算器の性能よりも、メモリアクセスの性能が、重要になる。
2016年11月に発表された、HPCGを使った性能ランキングでは、1位が京コンピュータの0.6027PFlops、2位が天河2号の0.5801PFlops、3位がOakforest-PACSの0.3855PFlops、4位がTOP500では1位の神威太湖之光の0.3712PFlops、5位がCoriの0.3552PFlopsというランキングになっている。
TOP500を主催するJack Dongarra教授は、HPLとHPCGはブックエンドと言っており、HPLは一番高いFlops値、HPCGは一番低いFlops値となる典型で、その他のアプリケーションの性能は、この間に入ると述べている。つまり、HPCG性能が高いスパコンは、メモリアクセスが複雑で、性能を出し難いアプリケーションでも、高い性能を出すやすいスパコンであると言える。
京コンピュータは、HPCGでは世界1位であり、まだまだ使えるスパコンであるが、京コンピュータがTOP500の1位になったのは2011年6月であり、それからすでに5年あまりを経過している。スパコンの更新間隔は5~6年であるので、京コンピュータは退役直前の古いシステムであり、国内では、より高いHPL性能を持つマシンがこれまで作られなかったことの方が不思議とも言える。また、HPCG性能で、京コンピュータを超えるマシンが国内に設置されるのは、何時になるのであろうか?
次回は2016年12月15日に掲載予定です。