NVIDIAのGTC Japan 2012において、同社の科学技術計算用GPUであるTesla部門のCTOのSteve Scott氏が基調講演を行った。Scott氏は昨年8月までCrayのCTOとしてXE6、XK6スパコンの開発を推進していた人である。

ということで、より技術的なプレゼンを期待していたのであるが、基調講演の内容は5月の米国でのGTCの基調講演とほぼ同じであった。Kepler GPUに関しても新しい情報は無かったが、Oakridge National LaboratoryのCray XK6システムであるTitanスパコンが紹介された。

GK110(Kepler 2)GPUを搭載するTitanスパコン

CPUの換装とGPUの搭載で「Jaguar」から「Titan」へと進化

2010年6月には世界最高速のスパコンであったOakridge国立研究所の「Jaguar」は、現在(2012年6月発表版)のTop500では6位に後退しているが、CPUを12コアのInterlagosに置き換え、NVIDIAのKepler 2 GPUを搭載することで20PFlops超の性能へのアップグレードが進められている。なお、このアップグレードでは大きく性能や構成部品が変わるので、システム名はJaguarから「Titan」に変わる。

スパコン界では、次回の2012年11月のTop500で、Titanが現在1位のIBMのBG/Qを使うSequoiaを抜いてトップに立つかどうかが注目の的である。基調講演の後のプレスQ&Aで、この質問をScott氏にぶつけてみたのであるが、「それはOakridge国立研究所が発表すること」とかわされてしまった。それでは、GK110 GPUの開発状況はと質問すると、「チップはすでに動いており、順調」という回答で、具体的に、18000個のGK110チップの供給が間に合うのか、GK110でどの程度の行列積性能が出るかについての具体的な回答は得られなかった。

プレスQ&Aで記者団の質問に答えるNVIDIA幹部。左から、GPU仮想化プロダクトマネージャWill Wade氏、Tesla部門CTOのSteve Scott氏、NVIDIA日本代表のSteve Furney-Howe氏

しかし、ロシア、インド、そして米国でも、近く(英語の表現はSoon)GPUを使ったスパコンがトップになると述べており、これはTitanがトップになることを示唆しているものと思われる。

世界1位のスパコンになるための最大の課題はTSMCの供給能力か?

Kepler GPUのホワイトペーパーでは、LINPACKでの中心的な処理である行列の掛け算性能が、Fermiではピークの60~65%であったのに対して、Keplerでは80%を超えると述べられている。ピーク演算性能が20PFlopsの TitanがLINPACKでピーク比80%(LINPACKでは行列積以外の計算も多少あるので、行列積の性能よりもピーク性能比率は若干下がる)を出せば、Sequoiaの16.3248PFlopsのLINPACK値に迫ることになる。そして、ピーク性能が20PFlopsをどの程度上回るか、LINPACK実行効率をどこまで引き上げられるかによって、Sequoiaを超えるチャンスは十分にある。

やはり、1位と2位は大きな差で、京スパコンも製造を前倒しして2011年6月のTop500で1位を手に入れており、Oakridge国立研究所もCray-NVIDIAも首位奪還に執念を燃やしていることは想像に難くない。いざとなれば、物量を積み増してでもSequoiaを抜こうとすると思われる。

そこで、ネックとなる可能性があるのが、TSMCの28nmプロセスのチップの供給状況である。2012年の終わり頃までは供給問題は解決しないという情報もあり、500平方mmを超えるGK110チップを18000個、期限までに揃えられるのかどうかがカギとなると思われる。また、チップの出来で、クロックがどこまで上げられるかも変わり性能に直接効いてくるので、目論見通りのチップが歩留り良く採れるかも問題である。

IBMが途中で撤退してしまい、CrayのXK6スパコンに切り替わったNCSAの10PFlopsスパコンBlue WatersもGK110 GPUを使用する。こちらも年内の納入と考えられ、NVIDAとしてはタイトな供給状況が続くことになると思われる。