科学技術計算の実行にあたって、スーパーコンピュータ(スパコン)の使いこなしを競うのがGordon Bell賞(ゴードンベル賞)である。2011年11月のSC11では、理化学研究所(理研)の長谷川氏らのチームが、京コンピュータを使い10万原子のシリコンナノワイヤーの電子状態のシミュレーションを行って、Gordon Bell最高性能賞を獲得し、東京工業大学(東工大)の下川辺氏らのチームがTSUBAME2.0を使い金属の凝固の様子のシミュレーションを行い、Gordon Bell特別成果賞を獲得している。

今年のGordon Bell賞候補論文は、

  1. Billion Particle SIMD-Friendly Two-Point Correlation on Large Scale HPC Cluster System
  2. Toward Real-Time Modeling of Human Heart Ventricles at Cellular Resolution : Simulation of Drug-Induced Arrhythmias
  3. Extreme-Scale UQ for Bayesian Inverse Problems Governed by PDEs
  4. The Universe at Extreme Scale - Multi-Petaflop Sky Simulation on the BG/Q
  5. 4.45PFlops Astrophysical N-Body Simulation on K Computer - The Gravitational Trillion-Body Problem

の5件である。

論文1はIntelとLBNLの共著の論文で、宇宙の広い領域の光学観測結果から2点間の相関を計算し、ランダムな分布からのずれを見つけることにより、ダークマターやダークエネルギーの理解に迫ろうというもので、どのようにして、膨大な観測データを処理して結果を得るかというのがポイントである。

論文2はLLNLとIBMの共著の論文で、人の心臓を細胞レベルでモデル化し、薬によって引き起こされる不整脈をシミュレーションするというもので、前回のTop500で1位となったSequoiaを使い、ピークの58.8%にあたる11.84PFlopsを達成している。

論文3はテキサス大学オースチン校他の論文で、結果のデータから原因を求めるベイズ逆問題で、地球規模の地震の観測結果からさかのぼって震源の様子を求めるという問題に関して、不確定性を量的に制御しながらこの問題を解くという論文である。

論文4はANL、LANL、LBNLの共著の論文で、Sequoiaを使い、ダークマターやダークエネルギーを探るという論文で、アブストラクトの記述では分からなかったが、発表を聞いてみると、宇宙の成り立ちからの発展をN体問題として解くという論文であった。アブストラクトでは2.52PFlopsを達成となっているが、DVDに収められた論文ではSequoiaの半分の規模の48ラックを使い、6.23PFlopsに引き上げている。そして、論文発表の当日には、Sequoiaのフルシステムを使い13.94PFlopsという高い値を叩き出したと発表された。

論文5は筑波大学と東工大の共著の論文で、論文4と同じく、N体問題で、宇宙の発展を解くという論文で、京コンピュータを使い4.45PFlopsを達成している。

論文5を発表する筑波大の石山研究員

冒頭で4.45PFlopsから5.67PFlopsに引き上げたことを発表

論文5を発表した筑波大の石山研究員は、冒頭で、5.67PFlopsに引き上げたことを発表したが、論文4と同じ分野の計算で、Flops値として2倍以上の差がある。

しかし、ここで逆転があり、筑波大/東工大の方の計算は1つの粒子の時間ステップあたりの計算にかかる時間は25psであるのに対して、ANLグループの方は、同じ計算に60ps掛っており、筑波大/東工大の方が2.4倍速いと指摘した。

Flops性能では14PFlopsの論文4(Habib)がIshiyamaより性能が高い

しかし、1粒子の1ステップあたりの計算時間では、Ishiyamaの方がHabibの約40%の時間しかかからず、性能が高い

後で、似鳥氏に話を伺ったところによると、N体問題は単純にすべての計算を粒子-粒子ペアで行うと計算量が増えるので、距離がある程度以上遠く、まとまった粒子群はひとまとめにして計算する。この粒子のまとめ方に差があり、Habibの方は粒子-粒子の計算が多く、全体としての計算量が多くなっている。一方、Ishiyamaの方は粒子群のまとめかたが良く、全体としての計算量が減って、計算時間は短くなっている。しかし、計算が減った分、浮動小数点演算の密度が下がるので、Flops値としては低くなっていると考えられるとのことであった。

Gordon Bell賞の表彰式。左から2人目が筑波大の似鳥氏、その右が東工大の牧野教授と筑波大の石山氏

そして、ピーク性能が11.28PFlopsの京コンピュータと、20.13PFlopsのSequoiaの違いを考慮すれば、同じマシンで比べると、さらに、筑波大/東工大の方が速いことになる。このようなプログラムの質の差が考慮されたと思われるが、Flops値だけからいうと論文4、論文3よりも低い値の筑波大/東工大のチームの論文5にGordon Bell賞が授与された。

なお、今年のGordon Bell賞は、この1件だけで、特別成果賞や次点に相当する奨励賞などは該当論文がなかった。

ということで、Sequoiaを使った2つの論文を抑えて、昨年に続いて日本がGordon Bell賞を制し、日本のスパコンと利用技術の高さを世界に示す結果となった。