最先端の半導体製造技術を盛り込んだプロセサ

次の図は地球シミュレータ(ES)のプロセサのブロック図である。ベクトルレジスタにビット列ベクトルの論理演算器、ベクトル論理演算器、ベクトル乗算演算器、ベクトル加減算演算器とベクトル除算演算器の合計6本のベクトル演算パイプが付き、ベクトルレジスタからデータを出し入れするロードストアユニットが付くという構成は、ベクトルスパコンとしては標準的な構成である。

ベクトルレジスタの長さは256要素で、72個のレジスタを持っている。そして、地球シミュレータのCPUはこのベクトル処理ユニットを8個持っている。

スカラ処理部は4Wayのスーパスカラで、64KBの命令キャッシュと64KBのデータキャッシュを持つ。汎用レジスタは128個である。

  • 地球シミュレータ

次の写真は、CPUチップのダイ写真である。写真のオーバレイに書かれているように8個のベクトルプロセサ(VPP)とスカラ演算を行うスカラプロセサ(SPU)が集積されており、150nm(0.15μm)プロセスで20.79mm×20.79mmという当時としてはほぼ製造限界の巨大チップである。

  • 地球シミュレータ

    地球シミュレータの1チップベクトルプロセサ。150nmプロセスで20.79mm×20.79mmという当時としてはほぼ製造限界の巨大チップであった

地球シミュレータのCPUはNECのSX-5スパコンのCPUの設計をベースに作られている。しかし、SX-5のCPUは0.25μmプロセスで作られ、30個余りのチップで作られているのに対して、地球シミュレータは0.15μmプロセスを使いCPUチップとMMU(Main Memory Chip)チップの2チップになっており、大幅に小型化されている。なお、MMUは今日では標準的なMemory Management Unitの略称ではなく、Main Memory Unitの略称なので、注意していただきたい。

これらのチップの諸元を次の表に示す。

地球シミュレータはSX-5の約2年後の完成予定であるので、SX-5より微細な0.15μmプロセスを使っている。そして、地球シミュレータでは、CPU部は1個のチップに詰め込んでいる。

CPUチップのサイズは20.79mm×20.79mmとなっている。集積度は、SX-5のCPUは15Mトランジスタであるが、地球シミュレータのCPUは57Mトランジスタを集積している。また、表には入っていないが、クロックは500MHzで、消費電力は約140Wである。

  • 地球シミュレータ

    地球シミュレータとその前身のSX-5のプロセサチップの諸元。ESのCPUは0.15μmプロセスで20.79mm角と最大級のチップで57Mトランジスタを集積。クロックは500MHz(ロジックの一部は倍速クロックを使用)

注意が必要なのはSX-5では金属配線層にアルミニウムを使っていたのであるが、地球シミュレータのLSIでは銅配線に替わったという点である。原理的には銅の方がアルミニウムより電気伝導率が高く、電気抵抗が小さく、大きな電流が流せる。しかし、銅配線はアルミニウム配線と違って、パターン依存性が大きく、正しい配線ルールを作るのが非常に難しい。NECも地球シミュレータで初めて銅配線を使って不良の山を築いたという。

140Wという大きな発熱を冷却するのは次の図に見られる8階建ての団地の建物のようにも見える沸騰冷却型の冷却フィンである。このヒートシンクには低沸点の液体が封入されており、チップの発熱で沸騰すると8階建ての床となっているフィンを通り、ここで冷却されて液体に戻り下に滴り落ちてチップを冷却する。もちろんフィンはファンで空冷されている。

この沸騰冷却フィンは気化熱を使っているので通常のヒートパイプの5倍の熱を運べる。ただし、重力による冷媒の滴下を使っているので、この図に書かれているように、垂直に立てたポジションで使う必要がある。

右側の写真の下側のプリント板に見える白いコネクタは、CPUとMMUインタフェースを接続する5185ピンコネクタである。

  • 地球シミュレータ

    発熱が大きいので、沸騰冷却を使うヒートシンクを使っている。通常のヒートシンクの5倍の放熱ができるという

地球シミュレータのCPUチップ1個に8台のプロセサが入っており、それに16GBの共有メモリが付いているものが1つの計算ノードを構成している。

(次回は10月16日に掲載します)