富士通のスパコン「VP-200」と日立のスパコン「S-810/20」は、計算上はS-810/20の方がVP-200より演算性能が高いのであるが、常に12本のベクタパイプラインを遊ばせないようにできるとは限らない。また、VP-200のクロックは7.5nsであるがS-810のクロックは14nsにとなっており、計算の準備にかかる時間が長く、S-810/20の方が速いとは限らない。

Los Alamos国立研究所のOlaf Lubeck氏らが発表した論文「A Benchmark Comparison of Three Supercomputers: Fujitsu VP-200, Hitachi S810/20, and CRAY X-MP/2」に、性能比較が行った表が掲載されている。

表では、Tsはベクタ処理が開始されるまでの時間(ns)、Teは1要素当たりの処理時間でクロックサイクル数(ns)の表記になっている。A(I)=B(I)+Sというベクタ演算の場合、Crayのスパコン「X-MP」は開始までに444ns掛かり、その後は1要素ごとに9.5ns掛かる。これに対して、VP-200は開始までに655ns掛かり、その後は1要素ごとに3.75ns掛かる。そして、S-810/20は開始までに1065ns掛かり、その後は1要素ごとに7ns掛かるというふうに読む。

どのような演算であるかによってスタートアップ時間と1要素あたりの処理時間が変わるので比較は難しいが、X-MPはスタートアップ時間は短いが1要素当たりの処理時間は長くかかる。それに対して、S-810/20は1要素の処理時間は短いが、スタートアップ時間が長い。

つまり、X-MPは短いベクタの処理は速いが、ベクタが長くなると処理時間が長くかかる。一方、S-810/20はスタートアップ時間が長く、短いベクタを処理する場合は性能が出ない傾向があると言える。

  • スパコン

    図2.15 Los Alamos国立研究所のOlaf Lubeck氏らの論文「A Benchmark Comparison of Three Supercomputers: Fujitsu VP-200, Hitachi S810/20, and CRAY X-MP/2」に掲載されている性能比較の表。Tsはベクタ処理が開始されるまでの時間(ns)、Teは1要素当たりの処理時間でクロックサイクル数(ns)の表記になっている (出典:A Benchmark Comparison of Three Supercomputers: Fujitsu VP-200, Hitachi S810/20, and CRAY X-MP/2)

そして、日立は1987年7月にS-810の後継機としてS-820を発表した。2500ゲートの論理LSIと7Kbit、2.5nsのメモリを集積した超高速のベクタレジスタLSIを開発し、S-820/80では、ピーク演算性能を3GFlopsに引き上げている。

S-820の論理ボードは、このECL LSIを最大96個搭載できるようになっていた。

(次回は7月5日の掲載予定です)