中国の天河1Aに次いで2011年6月にTop500の1位になったのは、日本の「京コンピュータ」である。日本のスパコンが1位になったのは2004年6月のTop500で1位だった「地球シミュレータ」以来で、7年ぶりとなる。次の表1に大37回のTop500の5位までを示す。

1位がK Computer(京コンピュータ)で、Rmaxは8162TFlopsである。前回まで1位であった中国の天河1AのRmaxは2566TFlopsであるから、LINPACKの計算では京コンピュータは天河1Aの3.18倍の性能を持って新たに1位になったわけである。

面白いことに、この回のTop500のトップ5を見ると、日本がK-ComputerとTSUBAME 2.0、中国の天河1AとNebulae、米国は3位のJaguarという顔ぶれでアジア勢が5システムの内、4システムを占めている。

  • 第37回 Top500

    表1 2011年6月(第37回)のTop500の上位5システム

SPARC64 VIIIfxプロセサは富士通が開発した8世代目のSPARCプロセサであり、fxがついているのは科学技術計算向けのプロセサであることを示している。SPARCは、元々Sun Microsystems(現Oracle)と富士通が共通仕様で開発してきたプロセサであるが、SPARC64 VIIIfxでは「HPC-ACE」と呼ぶ富士通独自の科学技術計算向けのアーキテクチャ拡張を付け加えている。

HPC-ACEでは、浮動小数点(Floating Point)レジスタの個数を、従来のSPARCの32個から256個に拡張している。そして、第1の命令の演算(オレンジ)と第2の命令の演算(青)を偶数番レジスタと奇数番レジスタのペアについてSIMD並列に実行するようになっている。

このSIMD並列で同じ演算を行うというやり方はIntelプロセサのSSEと同じ考えで、命令の処理機構はそのままで、ピーク演算性能を2倍に引き上げている。また、浮動小数点レジスタの個数を大幅に増やしたことにより、レジスタ不足のために中間結果をキャッシュに書き戻したり、再度、キャッシュから読み込んだりするロード、ストア命令を削減することができるので、演算性能を高めることができる。

また、HPC-ACEでは、繰り返し使われるデータと一過性のデータを格納するキャッシュ領域を分割し、一過性のデータの書き込みによって繰り返し使われるデータが追い出されることが無いようにするセクターキャッシュという機構が追加されている。

そして、京コンピュータ用に開発されたSPARC64 VIIIfxチップは8個のCPUコア、4チャネルのDDR3メモリインタフェースと計算ノード間を繋ぐICCとのインタフェース(HSIO)を1チップに集積している。

(次回は12月24日の掲載予定です)