Oak Ridge国立研究所がFermiをスパコンに採用する計画を発表

Oak Ridge国立研究所は、スパコンランキングのTop500で現在2位のJaguarを保有する研究所である。Jaguarは2.3GHzクロックの4コアOpteronを使用するCrayのXT5スパコンであるが、現在、同研究所は、この4コアOpteronを最新の6コアIstanbulに取り替えるアップグレードを推進しており、これが完了するとピーク性能は2.3PFLOPSとなり、2009年11月のランキングでは現在トップのRoadrunnerを抜いてトップの躍り出ると見られている。

このXT5はOpteron 2ソケットの計算ノードをSeaStar2+と呼ぶCray開発のスイッチチップを使い3次元トーラス構造で接続するシステムであるが、6コアIstanbullへの変更の次のステップとして、一方のソケットには12コアのMagny-Coursを入れ、もう一方のソケットにはNVIDIAのGPUを入れるというアップグレードを計画している。

ORNLの次世代(OLCF-3)の計算ノード構成(CAS2K9ワークショップにおける2009年9月13日の発表スライドから転載)

現在のJaguarは4コアOpteronで15万152コアを使用し、ピーク演算性能は1.38PFLOPS、LINPACKは1.059PFLOPSであるが、これに768GFLOPSのFermiが付くとなると、Fermi部分のピーク性能は14.4PFLOPSとなる。これは現在の最高レベルのスパコンの10倍のピーク性能のスパコンというORNLの発表と矛盾しない数字である。

現在のFermiはグラフィックスカードとして、ホストインタフェースはPCI-Expressインタフェースと考えられるが、このスライドによれば、AMDのHyperTransport3(HT3)版のFermiの開発も行われていると考えられる。このHT3直結版では、Opteron側のメインメモリもFermiから直接アクセスすることが出来るようになり、 GPUのグラフィックスメモリとOpteronのメインメモリが単一メモリ空間でアクセスできるようになる。こうなるとメインメモリとGPUの距離はグッと近くなり、プログラミングも容易になるし、性能的にも効果が大きいと思わる。

ということで、従来GPGPUがグラフィックス用のプロセサを科学技術計算用に流用している感じに対して、Fermiは科学技術計算を中心として考えたCUDA用のGPUとしてまじめに作ったという印象である。