スパコンの発展に大きな寄与があった人を表彰するSeymour Cray Computer Engineering Awardであるが、今回は、IBMでBlue Geneを開発してきたAlan Gala氏が受賞した。Gala氏は理論物理の博士号を持つ物理学者であったが、共同研究を行ったコロンビア大学の理論物理グループがQCDSPという量子色力学の専用コンピュータを開発しており、これに参加し1998年にはGordon Bell賞を受賞した。

そして、Gala氏は1999年にIBMに入社し、Blue Gene/L(BG/L)として知られるスパコンのテクニカルリーダとなった。その後もBlue Gene/P、そしてBlue Gene/Qのチーフシステムアーキテクトとして、低電力で高密度のスパコンシステムの革新を成し遂げたというのが今回の受賞理由である。また、同氏は引き続き、IBMのExascaleプロジェクトを担当しているという。

Cray賞の受賞講演を行うAlan Gala氏

1998年の終わりころから小さなグループで、エネルギー効率の高いスーパーコンピュータを検討し始め、Blue Gene/Lのコンセプトを固めていった。ローレンスリバモア国立研究所にアイデアを提案すると、気に入られて、共同で検討を行うことになった。同研究所のアプリケーションの専門家たちと、この小さなコンピュータの集合体のマシンにアプリケーションをどうマップさせられるかを検討し、少なくとも、紙の上では高い性能が出せることが分かったという。

そして、IBM社内から、ネットワークの専門家など必要な人材を引き入れて、開発チームの陣容を整えていった。また、本格的なGoを掛けるには社内のレビューを通す必要があるが、このレビューにはBill Dally教授など社外のコンピュータサイエンスの学者も加わり、有益な議論ができたという。

BG/Lの開発後Blue Gene/Q(BG/Q)の検討を始めたが、BG/Lが成功したことから、商業的にBG/Lからあまり変えないで短期間に後継マシンを作ることが必要になり、BlueGene/P(BG/P)を開発することになったとのことである。

その意味では、今回のBG/Qは、Gala氏にとって満を持して世に出す、本当の意味での次世代Blue Geneである。このBG/Qは、ローレンスリバモア国立研究所が2012年の稼働を目指す20PFlopsのSequoiaシステムに使用される予定である。

開発は順調に進んでいるようで、512プロセサチップのプロトタイプのLINPACK測定結果が今回のTop500の115位にランキングされている。また、IBMはSC10の展示会のIBMブースでBG/Qの計算ノードとI/Oノードを展示した。

BG/Qの計算ノードボードの全体図

BG/Qの計算ノードは2Uのサイズで、その中に32枚のプロセサボードが実装されている。8枚のボードが写真の奥行方向に列をなしており、この列が4列ある。ただし、1列ごとにボードの向きが反対になっており、左端の列はプリント基板側が見えており、その右の列はアルミのヒートスプレッダ側が見えているので、白っぽい色となっている。そして、左の辺を回り込んでいるオレンジ色のケーブルは筐体間の接続を行うための光ファイバケーブルである。

BG/Qの計算ノード(プロセサ-メモリ)モジュール

個々のプロセサボードは、この写真に見られるように中央にプロセサチップがあり、左右に18個ずつのDRAMチップが付いている。プロセサチップは18㎜角と18コアのチップとしては非常に小さい。そして、この写真ではゴールドに見える、ボードの上側に置かれているアルミの削りだしのヒートスプレッダがこの上に被せられる。そして、一部のDRAMチップには空色のペーストが付いているが、熱伝導率の高いペーストを介してCPUやDRAMチップの熱がアルミのヒートスプレッダに伝えられる。なお、DRAMチップは基板の裏側にも実装できるようになっており、最大では72個を搭載できる。従って、2GbitのDRAMチップを使うと最大16GBのメモリを搭載できる。しかし、裏面に搭載されたDRAMにはこのような放熱機構はなく、基板を経由してヒートスプレッダに熱を伝導しているようである。

Top500で115位となったプロトタイプで解いた問題は元数が43万4,175となっており、行列を格納するのに必要なメモリは約1.5TBである。ということは、このプロトタイプシステムは1Gbitチップを片面だけに搭載し、各ノード4GB、全体で2TBのシステムではないかと推測される。