12月14、15日の2日間、中国・北京で開催されたGPUコンピューティングに関する技術会議「GTC Asia 2011」で、NVIDIAの今後のHPC(ハイパフォーマンスコンピュータ)市場への取り組みや製品戦略が明らかになった。

GTC Asiaのクロージングスピーチには、Teslaの技術開発を統括するCTO(Chief Technology Office:最高技術責任者)に就任したスティーブ・スコット氏(Steve Scott)が登場。同氏は、今年8月までは大手スーパーコンピュータメーカーであるCrayの上級副社長兼CTOを務め、HPCがテラFLOPS、ペタFLOPSと演算性能を向上させる瞬間を見つめてきた人物でもある。

GTC Asia 2011のクロージングスピーチに登場したスティーブ・スコット最高技術責任者

その同氏は、HPC業界の誰もが認識するトレンドは、

  1. 演算性能の向上とエクサスケールの早期実現
  2. 電力効率の追究

の二つであることは明白だと説明。演算性能の大幅向上と省電力性の追究の両方を実現できるソリューションこそ、CPUとGPUが密接に連携を採り、並列処理性能を引き上げるヘテロジニアスコンピューティング(NVIDIAが言うところの"GPUコンピューティング")だという見方を示す。こと、電力効率の追究はHPC業界においては急務だ。

エクサスケールHPCの実現は、科学の発展にも大きく寄与すると、その実現を急ぐ必要性を説く

スコット氏は、スーパーコンピュータ500傑の歴史を振り返り、1993年に当時世界No.1の演算性能を持っていた米ロスアラモス国立研究所のThinking Machines CM-5/1024が65.5ギガFLOPSを200キロワットで実現していたのに対し、現在世界最高性能のHPCとなった「京」は8.16ペタFLOPSの演算性能に最大10メガワットを必要とすることを指摘。エクサスケールHPCの実現には、この消費電力の問題が大きな壁となって立ちはだかっていると説明する。その一方で、HPC業界は2018年にエクサスケールHPCを実現する米国防総省の先端技術開発研究機関DARPA(Defense Advanced Research Project Agency)の「Ubiquitous High Performance Computing」(UHPC)プログラムにおいて、20メガワット以下でエクサスケールHPCを実現することを求められており、欧州でも同様のHPCを2019年に実現する計画がスタートしている。ジェンスン・ファンCEOが、GTC Asiaのオープニングキーノートで「2019年には、20メガワットでエクサスケールを実現」としたのには、これらのHPC計画とも密接な関係にある。

スーパーコンピューター500傑のパフォーマンス推移。1993年にNo.1だったThinking Machines CM-5/1024が65.5ギガFLOPSを200キロワットで実現していたのに対し、現在世界最高性能のHPCとなった「京」は8.16ペタFLOPSの演算性能に最大10メガワットを必要とする

しかし、HPCの低消費電力化には数多くの技術的挑戦が待ち構えている。単にGPUをHPCに活かすだけでは済まないことも、NVIDIAは認識している。HPCのエネルギー効率向上を成し遂げるためには、

  • プロセッサのオーバーヘッド低減
  • データ移動の最小化

が不可欠であると、スコット氏は指摘する。

プロセッサのオーバーヘッド低減については、現在主流のCPUの非効率性を指摘し「CPUのマルチコア化は進んでいるが、いまだにシングルスレッド性能追究すべく、エネルギー効率の追究を二の次にしている」(スコット氏)とし、「現在主流のCPUが演算に利用するのは、チップ全体の消費電力のわずか2%以下に過ぎない」と、そのエネルギー効率の低さを早急に改善すべきであるとアピールする。その一方で、「AMDは、Bulldozerアーキテクチャでこの問題に取り組んでいるが、シングルスレッド性能を犠牲にすることになるため、同CPUに対する市場の反応は実にネガティブだ」と、CPUのエネルギー効率改善には、まだまだ多くの課題が存在していると見る。また、データ移動の最小化については、ことCPUベースの大規模システムにおいては、クラスタやノード間のデータのやり取りに多くの電力を必要としているとして、システム全体でも電力効率改善を検討していかなければならないとアピールする。

エクサスケールHPCの実現には、さまざまな技術的チャレンジが待ち構える。とくに、CPU性能の向上ベースの鈍化や消費電力の増加は頭の痛い問題だ

CPUのマルチコア化が進んだとはいえ、現在でもCPUが演算に利用するのは、チップ全体の消費電力のわずか2%以下に過ぎないと言う

今後のHPC開発では、電力効率を最優先に進める必要性を説く

HPCのエネルギー効率向上を成し遂げるためには、プロセッサのオーバーヘッド低減とデータ移動の最小化が必要となる

そこで、HPC業界はGPUをアクセラレータとして活用する方向に進んでいることは、現在のスーパーコンピュータ500傑において上位5システムのうち3システムにGPUベースのHPCがランクインし、2012年には米オークリッジ国立研究所のHPC「Jaguar」が18000基のTesla GPUを採用し20ペタFLOPS以上の演算性能を実現する「Titan」に置きかえられることも、GPUコンピューティングというトレンドがHPC業界全体に浸透しつつある証拠だと、スコット氏は説明する。

CPUは1GFLOPSの性能を得るために1690ピコジュールのエネルギーを必要とするのに対し、GPUはわずか225ピコジュールと電力効率では大きな優位性を持つ

GPUコンピューティングは、さまざまなジャンルに裾野を広げている

現在のスーパーコンピュータ500傑でもTOP5のうち3システムをGPUコンピューティングシステムが占める

米国最速のHPCであるオークリッジ国立研究所の「Jaguar」は、2012年に18000基のTesla GPUを採用し20ペタFLOPS以上の演算性能を実現する「Titan」に置きかえられる