日本のスパコンを育てたのは、三好甫(みよし はじめ)先生である。三好先生は航空宇宙技術研究所に居られた時代に富士通とFACOM 230-75 APUという付加プロセサ型の浮動小数点計算を行うアクセラレータを開発し、続いてNWT(Numerical Wind Tunnel:NWT、数値風洞)というスパコンを富士通と開発した。NWTは1993年11月から合計4回Top500の1位を保持した。

そして、三好先生は航空宇宙技術研究所を定年退官された後、材料科学技術振興財団の参与などを経て日本原子力研究所地球シミュレータ開発特別チームリーダ、海洋科学技術センター地球シミュレータセンター長を務めた。

三好先生の考え方は、スパコンを作るには3つの組織化を行う必要があるというものである。第1は役所の組織化で、予算を付けてくれる応援団を組織化することが重要。第2はエンジニアの組織化で、本当にそのスパコンを作る人達の組織化である。そして、第3の組織化はそのスパコンを使ってくれるユーザの組織化で、良いユーザが居るスパコンは幸せなスパコンであるという考えである。

三好先生の第3作のスパコン「地球シミュレータ」

その三好先生がNWTの次に取り組んだスパコンが「地球シミュレータ」である。当時は地球温暖化などが問題という意識が高まってきた時代で、地球全体の空気の流れや、海水の流れを10kmメッシュというような高い精度でシミュレーションしたい、また、地震やマントルの移動など、個体地球の高精度モデルのシミュレーションも行いたい。それができる高性能のスパコンを開発しようという動きが出てきていた。

NWTは富士通が受注したが、地球シミュレータ(ES:Earth Simulator)はNECが受注した。地球シミュレータでは緯度、経度方向は、従来の1/10となる10km、高さ方向も数倍に細かくし、時間刻みも1/10に短縮することが必要であり、従来のモデルに比べて数千倍の計算が必要になる。この為には、大気循環モデルの実効演算性能で5TFlopsの実現が必要で、理論ピーク性能では32TFlops以上の性能が必要と見積もられた。

地球シミュレータは、2002年6月にピーク性能40.96TFlops、Linpack性能35.86TFlopsを出し、Top500で1位に輝いた。そして、地球シミュレータは2004年6月まで5回連続してTop500で1位の座を保った。

次の写真は、横浜市金沢区の海洋開発研究機構の横浜研究所内の地球シミュレータセンタに設置された地球シミュレータの外観である。

  • 地球シミュレータ

    横浜市金沢区の海洋開発研究機構(JAMSTEC) 横浜研究所に作られた地球シミュレータセンタに設置された地球シミュレータ (出所:Top500 Webサイト)

そして、三好先生の設計思想は、どんな使い方でも性能が出るコンピュータで、キャッシュなどで、ヒット率が高いときは高い性能が出るが、キャッシュミスが増えると性能が落ちるという作り方を嫌い、ネットワークも最大通信負荷に耐えるクロスバであるべき、というものであった。これはトリッキーな最適化をしなくても性能が出る、アプリケーションのプログラマにやさしい設計を目指すという設計思想である。

メインメモリとして富士通のFPLメモリを採用

この設計思想を実現するため、NECはメインメモリとして富士通が開発・製造したFull Pipe Line(FPL)Memoryという特別なDRAMを採用した。DRAM内部の動作をパイプライン化し、8バンクそれぞれが独立の3段のパイプラインとして動作する。このため、ランダムアクセスのサイクルタイムは実効的に1/3に短縮された。そして、普通のDRAMの2倍の8バンクを持っているので、普通のDRAMを使うメモリと比べると実効的に6倍のメモリバンド幅となる。

次の図は一般的なスカラマシンとES(Earth Simulator)のメモリバンド幅を比較した図で、CPU部ではESの性能は1.5倍程度で差は小さい。しかし、メモリからCPUにデータ転送するバンド幅はスカラ機では25.6GB/sであるのに対してESでは10倍の256GB/sの性能を持っている。さらにESのメインメモリのバンド幅は463GB/sとスカラ機の36倍となっている。これが大量のメモリアクセスが必要な大規模な科学技術計算性能に効いてくることとなった。

  • 地球シミュレータ

    一般的なスカラ機(右)とESのメモリのアクセス速度の対比。CPUの演算性能は1.5倍程度で差は小さいが、ESのメモリバンド幅はスカラ機の10倍以上。メモリバンド幅が律速のアプリでは、NECの地球シミュレータは高い性能を発揮する

2020年10月2日訂正:記事初出時、NECがメインメモリとしてFPLメモリを開発したと表記しておりましたが、FPL DRAMを開発したのは富士通で、NECはそれを購入して使用した側となりますので、当該箇所を修正させていただきました。また、2つ目の図にて、メモリバンド幅が律速のアプリでは、「ベクトルスパコンは高い性能を発揮する」と表記しておりましたが、こちらにつきましても、「地球シミュレータは高い性能を発揮する」と修正させていただきました。ご迷惑をお掛けした読者の皆様、ならびに関係各位に深くお詫び申し上げます。

(次回は10月2日に掲載します)