理化学研究所(理研)とNVIDIAの日本法人であるエヌビディア・ジャパンは1月28日と29日の2日間にわたり、科学技術計算を加速させるアクセラレータとしてGPGPUがどういった分野に適しているのかを討論する「Accelerated Computing」を開催した。

理化学研究所 基幹研究所 先端計算科学研究領域 システム計算生物学研究グループ グループディレクターの泰地真弘人博士

スパコンに用いられる汎用アクセラレータは、現在主なものとしては「Clearspeed」「GRAPE-DR」「GPGPU」などが挙げられるが、「GPGPUについては、NVIDIAがCUDAの提供を開始して以降、爆発的に広がった」(オープニングスピーチを行った理研 基幹研究所 先端計算科学研究領域 システム計算生物学研究グループ グループディレクターの泰地真弘人博士)という状態となっており、今後、より広い科学技術分野での計算速度を向上させるためにはアクセラレータとして「メニーコアに対応すること、かつプロセッサ-アクセラレータ間の通信速度を改善したものが望まれる」(同)という。

何故GPUが科学計算に用いられるのか

NVIDIAのCEO兼創業者であるJen-Hsun Huang氏

こうした背景を元に、初日となる28日の基調講演にはNVIDIAのCEO兼創業者であるJen-Hsun Huang氏が登壇。「何故、スーパーコンピュータ(スパコン)に新しいアーキテクチャが必要なのか」、「何故、GPUが最適な選択肢となりうるのか」、「何故、NVIDIAがGPGPUに注力するのか」という3つのトピックスについて講演を行った。

現代はあらゆる分野で科学計算が用いられている。学術的な分野はもちろん、自動車の空力計算や金融市場の予測などにも用いられている。近年、その計算量は膨大に増えたが、実際に使用できる処理能力と要求される処理能力の間に乖離が生じ、その差は年を追うごとに広がってきている。

科学計算はいたるところで活用されている。現代は正に科学計算の時代と言える

「スーパーコンピュータの性能向上は、そのままシミュレーションの性能向上にもつながる。それは新たな研究室の誕生を意味する」とHuang氏は指摘する。高速演算が可能な仮想的な研究室を形成することで、例えばブラックホールの形成過程や銀河団の衝突前後の様子などの理論をシミュレーション上で高速に描画することも可能となるため、そこからより多くの新たな知見を得ることができるようになる。

また、スパコンの性能向上とともに、システムコストの低減も進んできた。一番のポイントは1999年に登場したIntelのPentium IIIがSSEを搭載したこと。これによりx86系プロセッサがスパコンでも多く用いられるようになり、一気にシェアを拡大させることとなった。こうした流れは安いコモデティ製品が高いカスタム製品を駆逐したとも言えるが、そうした動きも近年、問題が生じてきた。それはCPUのスケーリング則の終焉。これにより、スパコンの性能向上の速度が鈍化が始まった。1980年代後半から2000年代初頭までのパフォーマンスは年率52%程度の向上が続いてきた。結果として、80年代から90年代の10年でGFLOPSからTFLOPSへ、90年代から00年代の10年間でTFLOPSからPFLOPSへと1000倍の性能向上を果たしてきた。

SSEを搭載したx86プロセッサが安価で供給されることにより、HPC分野における搭載CPUの比率に変化が生じ、現在ではほぼx86プロセッサがメインとなっている

だが、2000年代に入ると、平均成長率は20%程度となっている。もし、年平均52%の性能向上を維持し、性能を10年前と比べて1000倍に向上させた場合と現在の年平均20%の性能向上が続いた場合を比べると、「2016年にはその性能差は1000倍に広がる」(同)という試算が出ており、こうした乖離を小さくするためにもスーパーコンピュータには新たなアーキテクチャを導入する必要が求められることとなる。

CPUの性能向上の鈍化により、そのパフォーマンスが向上する速度が低下。結果として従来のまま進化した場合と現状の技術の延長線上では大きな差が生まれることとなる

こうした1コアあたりの性能向上の頭打ちに対応する方法として考えられたのがマルチコアだが、マルチコアにはそれに見合ったソフトウェアを用意する必要がある。その鍵がNVIDIAではGPUであることを強調している。並列プロセッサとしての演算性能向上だけではなく、コンシューマ向け製品としての低価格化、そしてコンシューマ向けとして行われる大規模な研究開発がそのままGPGPUにもフィードバックされることで、「スーパーコンピュータのコストを下げながらも性能を向上させることが可能になる」(同)と意気込みを見せる。

4コアXeonを2つ用いたシステムと、それにTeslaを2台追加した場合の分子構造の3次元表示アプリケーションである「VMD(Visual Molecular Dynamics)」と質量化学ソフトウェアパッケージ「TeraChem」の性能対コストの比較

同氏の意気込みは市場の後押しも関係している。実際にSC07でのNVIDIAのGPUを活用した展示はNVIDIAのみであった。しかし、1年後のSC08では33ブースに、そして2009年に開催されたSC09では75ブースにまで拡大している。

SC09でのNVIDIAのブースなどの様子。年々GPUを活用した展示を行うブースが増えてきている