東京工業大学(東工大)は6月16日、NECと日本ヒューレット・パッカード(日本HP)の企業連合が落札した同大の次世代スーパーコンピュータ(スパコン)「TSUBAME2.0」の概要説明などを行った。また、併せて北海道大学および情報・システム研究機構 国立情報学研究所(NII)と3機関連携協定を2010年7月に締結し、次世代の省エネスパコンの実現を目指した要素技術開発を行っていくことも発表した。

TSUBAME2.0の説明会に参加した企業および大学関係者。右から東工大学術国際情報センター長の渡辺治教授、NEC執行役員プラットフォームビジネスユニット ITハードウェア事業本部長の丸山隆男氏、日本ヒューレットパーッカード 執行役員ESSプリセールス統括本部長の山口浩直氏、東工大理事・副学長(研究担当)の伊澤達夫氏、東工大 学術国際情報センターの松岡聡教授、エヌビディア日本代表兼米国本社ヴァイスプレジデントのスティーブ・ファーニー・ハウ氏、マイクロソフト業務執行役員 最高技術責任者の加治佐俊一氏(右写真のプロジェクタに投影されているのは同時中継された北海道大学の理事・副学長である岡田尚武氏ら)

具体的なTSUBAME2.0に関する説明を行ったのは、TSUBAME1.0から携わってきた同大 学術国際情報センターの松岡聡教授。TSUBAME2.0は2010年11月1日より稼働予定で、理論ピーク値は2.4PFlops。システム、ソフトウェア、冷却設備、そして4年間の運用費用などまで含めた総額は約32億円弱が予定されており、特長としては「世界一クラスのペタスケールスーパコンピュータ(ペタコン)」「グリーンスパコン」「クラウド型スパコン」「大学での基礎研究とメーカーとの共同開発の成果」の4つがあるという。

TSUBAME2.0のみで、既存の日本のスパコンすべてを合わせた性能より上となる

TSUBAME2.0は主幹のNECを除けば日本外の企業の製品、技術で構成されるグローバルなシステムとなっている

これまでのTSUBAME1.X世代は1.2でGPUをアクセラレータとして追加したが、今回は始めからGPUとCPUのハイブリッドスパコンとして構築、これにより「ベクトル型プロセッサであるGPUの特性を生かしたベクトル・スカラ混合アーキテクチャで高い性能を実現するためにメモリバンドにも気をつけた」(松岡氏)としており、倍精度の理論ピーク値2.4PFlopsのみならず、メモリバンド幅も地球シミュレータの4.3倍となる0.72PBpsを達成しているという。

GPU+CPUによるスカラ・ベクトル混合型アーキテクチャを採用

また、「いくつものノードをつなぎ合わせて無尽蔵に電力を使えば性能は上がるが、それではグリーンに、という世の中の流れが許さない」ということで、電力消費は従来とほぼ同等の1MW/年以下で、密閉型冷却ラックの導入や部屋全体の空調の改修などを行った結果、PUE(Power Usage Effectiveness:電力使用効率)は「日本のスパコンセンターでは少なくともトップとなるはず」とする1.28を掲げ、「将来的にはさらに低くできるはず」との意欲を見せる。

TSUBAME2.0のシステム概念図

さらにクラウド型スパコンとしては、Windows HPCやLinuxなどの複数のOSを動的に変更することが可能な「動的プロビジョニング機構」の採用や、仮想化によるさまざまなデータセンターのホスティング機能のサポートなどが予定されている。

TSUBAME1.0やほかのスパコンなどとの各種性能比較

そして、最大の特長と言えるのが、これまでのTSUBAME1.2を活用したGPUコンピューティングへのノウハウと、そうしたノウハウを盛り込み、HPと独自のサーバを共同開発したこと。「各ノードに3枚のGPU(NVIDIA M2050)と複数ネットワークを搭載させることで、小型化を実現した」とのことで、TSUBAME2.0が収められるサーバルームは全体で200m2程度、実にTSUBAME1.Xの2/3以下に縮小できるようになったという。

HPと共同開発した独自の計算ノードを活用することで、2.4PFlopsの性能を実現する

また、併せて発表された「スパコングリーン化に関する大規模実証実験のための3機関連携協定」について、同大学術国際情報センター長の渡部治教授が概要を説明した。

同連携に関する実際の協定締結は7月に行われる予定で、3機関が連携することになった背景を「ペタコンが本格的に利用されるようになってきており、システムが大規模化、複雑化し、結果として運用コストの増大が問題となることから、3者がおのおのの特長を生かす形で、そうした問題解決に向けた研究を行っていく」と説明する。

この連携の主なポイントは2つ。1つは電力削減をターゲットとした「運用における省エネ化」。そしてもう1つは「省エネ計算技術の開発」となっている。

運用の省エネ化は、従来、常時メンテナンスが求められるスパコンの運用管理を、ネットワークを活用し将来的には無人で、かつリモートで自律運用できることを目指す。「例えれば、人間の脳のように故障検知、自己修復といったことができるようなシステム」と表現する。

一方の省エネ計算技術については、「例えばデータセンターが自然大気冷却などを導入し始めているが、これをスパコンの世界に取り入れようとすればそこには熱密度が局所的に3倍になったりする課題などを解決する必用がある。そうした技術革新を目指したり、計算の平準化技術などの開発を行っていく」とする。

具体的には、東工大でコンテナ搭載型のスパコンを構築。これを北大に設置し大気冷却を利用しながら、NIIのネットワークを活用してリモート運用する計画。期間は2011年度から2015年度で、これにより、PUE1.0を実現し、かつリモート自律運用による消費電力・メンテナンスコストの削減に向けた要素技術を研究することとなる。

なお、TSUBAMEのロードマップとしては、2012年初頭のテクノロジーを前提とした11~14PFlops級のTSUBAME2.5の基本設計がすでに存在しているとするほか、2014年末もしくは2015年初頭には30PFlops級を実現するTSUBAME3.0の実現を目指す計画としている。