先般のIBMがBlue Watersプロジェクトから撤退というレポートを見て、これで日本の「京」のトップはしばらく安泰と思った人が多くいるようであるが、米国のスーパーコンピュータ(スパコン)開発はBlue Watersがこけても次の矢がある。

その1つは、オークリッジ国立研究所(ORNL)の「Jaguar」の「Titan」へのアップグレード、もう1つは、ローレンスリバモア国立研究所(LLNL)がIBMと開発を行っている「Sequoia」である。Titanはギリシャ神話に出てくる巨人族の名前であり、Sequoiaは米国を代表する巨木の名前である。

CPU+GPU構成で20PFlopsを狙うTitan

オークリッジ国立研究所のJaguarシステムは、CrayのXT5ベースのシステムで2010年6月のランキングまではTop500の1位であり、「京」が1位になった2011年6月のランキングでも3位を保つ、現在の米国では最大のスパコンである。このJaguarシステムは、2.6GHzクロックの6コアOpteron CPU(開発コード名:Magny-Cours)を3万7000個あまり使用し、ピーク性能は2.33PFlops、LINPACK性能は1.759PFlopsというシステムである。

オークリッジ国立研究所は、このJaguarに使用されているCrayのXT5を新製品のXK6にアップグレードし、20PFlopsのTitanスパコンを作る計画である。

オークリッジ国立研究所のTitanシステムの概要(TitanWebinarの資料から転載)

Cray XK6の計算ノードのブロック図(TitanWebinarの資料から転載)

XT5ではCPUは6コアの「Magny-Cours」であったが、XK6では12コアの「Interlagos」となりコア数が倍増するが、XT5では4個のソケット全部に「Magny-Cours」を搭載していたのに対して、XK6ではCPUは2ソケットで、残りの2ソケットのスペースにNVIDIAのGPUを搭載する構成となっている。そして、計算ノード間を接続するインタコネクトが次世代の「Gemini」にアップグレードされる。

オークリッジ国立研究所のアップグレード計画は以下のようになっている。

JaguarからTitanへのアップグレードの工程(TitanWebinarの資料から転載)

まず、2011年の9月から12月に掛けて現行のシステムをXK6にアップグレードする。これは、96キャビネットと104キャビネットと2回に分けてアップグレードされる。2011年のアップグレードではGPUは試験的な導入であり、10キャビネット程度にNVIDIAのFermi GPUを使うX2090ボードが搭載される。そして、2012年の後半に、全ノードにNVIDIAの次世代GPUであるKeplerを搭載するという第2段階のアップグレードが行われる。

Interlagos CPUのクロックは公表されていないが、消費電力の制約を考えると、現在のMagny-Coursの2.6GHzより上がるとは考えにくく、現在の2.33PFlopsとあまり変わらない性能になると予想される。一方、GPUは665GFlopsのX2090の場合でも、全ノードに搭載するとキャビネットあたり85TFlopsで、200キャビネットでは合計17PFlopsとなる。これでCPUと合わせると約20PFlopsのシステムという計算になる。

Keplerの仕様は公表されていないが、NVIDIAは現在のFermiの3倍の性能と言っているので、これをFlops値で3倍と考えるとGPU部分は50PFlopsになる可能性がある。

3代目Blue Geneを搭載するSequoia

そしてもう1つのスパコンがローレンスリバモア国立研究所とIBMが開発を進めるSequoiaである。Sequoiaは、IBMのBlue Geneシリーズの3代目のプロセサであるBlue Gene/Q(BG/Q)を使用するシステムでピーク性能は20PFlopsと言われている。

BG/Qの計算カード。基板の中央の黒いのがCPUチップで、その両側にDRAMチップ(一部は放熱ペーストがついておりパッケージは見えない)が搭載されている。上側に見える金色のものは放熱用のアルミプレート

BG/Qチップの詳細は公開されていないが、16コアのチップであり、Top500に登録された小規模システムの性能からクロックは1.6GHzでチップあたりのピーク演算性能は204.8GFlopsと考えられる。

この計算カードが次の写真の計算ノードボードに32枚搭載される。

SC10で展示されたBG/Qのノードボード

そして、キャビネットには32計算ノードボードが収容されるので、キャビネットあたり1024 BG/Qチップで約210TFlopsとなる。

Sequoiaシステム全体は次のような構成となっており、Sequoiaスパコンのソフトウェア開発用のDawnシステムなどローレンスリバモア国立研究所のいくつかのシステムをSequoiaのSANスイッチで結合したシステムとなっている。そして、この資料ではSequoiaスパコンの性能としては14PFlops、オプションで20PFlopsと書かれているが、これまでのBlue Geneベースのシステムの最大構成の96キャビネットを使い20PFlopsとして、日本の「京」スパコンを超える性能を狙うという見方が一般的である。

2008年2月のこの資料では、このシステムが出来る時期として2010/11と書かれているが、Sequioaスパコンが稼働するのは2012年になると見られる。

今回のIBMのBlue Watersプロジェクトからの撤退は驚きであったが、金のかかるスパコンをBlue GeneとPOWERの2系列で開発するという状態を解消する狙いもあったのではないかとも思われる。

2011年の終わりに完成するTitanの第1次アップグレードではGPUは10キャビネット分程度しか搭載されないのでピーク性能でも3PFlops程度であり、「京」スパコンを抜くことはないと考えられる。しかし、2012年になると20PFlopsのSequoiaが完成し、LINPACKで15PFlops程度を叩き出して「京」を抜くと考えられる。また、2次アップグレードを終わって完成したTitanは、Kepler GPUの性能に依存するが、ピーク性能は20PFlopsを大幅に超え、Top500でSequoiaを抜く可能性もある。

今回、Blue Watersプロジェクトがつまづいたことで、2011年11月のTop500は「京」のトップは揺るがず、2012年の6月もトップを維持する可能性も高い。しかし、中国からダークホースが出てくる可能性も無視できないし、2012年の11月の時点ではTitanやSequoiaにトップの座を奪われる可能性が高い。しかし、このようなトップの交代は常に起こることであり、競争は2015年ころの100PFlops、2018~2020年ころの1Exa Flopsスパコンの開発へと移っていく。