次の表1に、第39回(2012年6月)までにTop500の1位となったスパコンの一覧を示す。
第1回(1993年6月)に1位になった「CM-5」の性能が0.06TFlopsであったのに対して、第39回(2012年6月)の1位になった米ローレンスリバモア国立研究所の「Sequoia」における、LINPACKの演算性能は16320.0TFlopsとなっている。トップスパコンの性能は、この19年の間に2万7200倍に向上している。これは年率にして51.6%という高い性能向上率である。
そして、この間に米国のスパコンがトップを取ったのが8回、日本のスパコンがトップを取ったのが6回、中国のスパコンがトップとなったのが1回という内訳である。ただし、このカウントには最近の10年(2012年11月以降)は含んでいない。
SequoiaはIBMが開発した3代目のBlueGeneスパコンである。図2にBG/QのCPUチップのダイフォトと諸元を示す。
BG/Qのプロセサチップは、IBMの45nm SOIプロセスで作られ、1チップに18個のプロセサコアと32MBのL2キャッシュ、2チャネルのDRAMコントローラ、そしてチップ間の接続を行うルーターなどを集積している。
BG/QチップはIBMのCu-45テクノロジで作られ、チップサイズは360mm2で1.47Bトランジスタを集積している。このLSIはSilicon on Insulator(SOI)テクノロジで作られ、トランジスタとシリコン基板の間に絶縁体を挟んでいるので、トランジスタに寄生する静電容量が小さい。また、配線には当時一般的であったアルミニウム(Al)に替えて、低抵抗で大きな電流が流せる銅(Cu)を使うというIBM開発の高性能半導体プロセスを使っていた。
CPUチップには18個のプロセサコアを搭載しているが、アプリケーションの計算処理に用いるのは16コアで、その他の1コアはOSを動かすコアとなっている。そして、もう1つのコアは不良を許容して歩留りを上げるための冗長コアである。なお、コアの接続は可変になっており、不良コアは1コアであれば、どの位置にあっても排除してチップ全体としては完全良品にすることができるようになっている。
そしてEmbedded DRAM(eDRAM)で32MBの全CPUコアで共通のL2キャッシュを作っている。
プロセサクロックは1.6GHzとなっており、各コアは1サイクルに8浮動小数点演算を実行できるので、チップのピーク演算性能は1.6G×8×16(コア)=204.8GFlopsとなる。そして、この時の消費電力は55Wとなっている。京コンピュータでは別チップとなっているインタコネクトネットワークのルーターなどもCPUチップに集積しており、ルーターなどの消費電力を含めても、京コンピュータと比べて半分程度の消費電力である。結果として、Sequoiaは京コンピュータの2倍以上の性能/電力比を実現している。
(次回は3月4日の掲載予定です)