NECと日本ヒューレット・パッカード(日本HP)は10月6日、ハイパフォーマンス・コンピューティング(HPC)分野においてGPUを活用することで、高い演算能力を実現する計算インフラを提供していくことを目指した協業を開始することを発表した。

日本HPのエンタープライズサーバー・ストレージ・ネットワーク事業統括インダストリスタンダードサーバー事業本部の事業本部長である林良介氏

両社の提携について、日本HPのエンタープライズサーバー・ストレージ・ネットワーク事業統括インダストリスタンダードサーバー事業本部の事業本部長である林良介氏は、「HPC分野においてもx86アーキテクチャが市場を拡大してきているが、ベクトル演算が要求される分野も多く残っている。そうした分野にGPGPUやGPUコンピューティングといった言葉に代表されるGPUをアクセラレーターとして活用する手法を用いることで、従来スーパーコンピュータ(スパコン)でしか得られなかった性能を、x86を用いて実現できるようになってきた」(同)と背景を説明するが、「その一方で、単にGPUをサーバに搭載しただけでは性能は向上しない。また、大規模演算になればCPUとGPUの通信帯域の不足などのボトルネックによりパフォーマンスを引き出せないなどの課題があった」(同)と指摘、そうした課題を東京工業大学の次世代スパコン「TSUBAME 2.0」をNECとHPが中心となり構築、そこで得たGPU活用のノウハウなどを製品やサービスとして提供することで解決を図り、主に研究開発分野に向けてGPUコンピューティングの浸透を図っていくとする。

HPC市場の主流はx86だが、ベクトル演算が得意とする分野もまだまだ根強く残っている

協業における両社の役割分担は、TSUBAME 2.0で実際に行ったのとほぼ同じで、HPがGPU搭載サーバなどのハードウェアを提供、NECがHPのサーバ製品などとベクトルスパコンなどで蓄積してきたベクトル演算向けノウハウなどを用いたコンサルティングやチューニングなどを組み合わせて、サービスとして提供を行うという形となる。

NECのHPC事業部長である久光文彦氏

NECとしては従来HPC分野はSX-9に代表されるベクトルスパコンが中心であったが、2010年4月にPCクラスタ選任の新組織を設立、スカラ事業の拡大を進めようとしている。今回の協業もその1つとなっている。GPUコンピューティングの各種ノウハウについてNECのHPC事業部長である久光文彦氏は、「NECはTSUBAME1.0の時代からシステムインテグレータとして導入などを行い、TSUBAME2.0もそうした流れの中で手がけてきた。TSUBAME2.0はPCユーザーにも簡単に使えるということを前提に、省エネなども実現することを目指して、まだ普及期に入っていない技術なども盛り込んだトータルソリューションとして提供したものであり、従来のベクトルスパコンからのベクトル演算の知見と新たにGPU向けに得た知見の総量は、世界トップクラス」であり、アプリケーションの高速化のためのチューニングからアプリ活用ノウハウ、大規模GPUクラスタ構築技術などをトータルソリューションで提供できる数少ないベンダと説明する。

NECと日本HPの協業イメージ

こうして提供されるソリューションは「CUDA化コンサルティング」「CUDA化支援」「CUDAコード高速化」「導入時トレーニング」「導入後問い合わせ」などを予定しており、すでに名古屋大学よりGPU搭載のスパコン(176ノードで62.41TFlops)の受注も果たしているという。また、今後は販社にも各種ノウハウ含めたトータルソリューションを提供していくことで、さらなる市場拡大を目指すとしており、3年間でシステムインテグレータとして200億円の打ち上げを目指すとしている。

ベクトル型スパコンとGPUコンピューティングはアプリケーションをどう動かすかなどの点で共通性が高く、これまでの同社が蓄積してきた知見を生かすことが可能な分野となっているというのがNECの主張

NECの提供するGPUコンピューティング向けサービス各種。こうしたノウハウを販社にも提供していくことで、販売の拡大を図るという

一方のHPはGPUを3枚搭載したサーバ「HP ProLiant SL390s G7 2Uサーバ」を同日に発表している。こちらは、スケールアウト型システム向け筺体「HP ProLiant s6500シャーシ」(4U)に4ノード搭載することが可能なサーバで、NVIDIAからOEM供給を受けて提供されるヒートシンクタイプのTeslaモジュール「Tesla M1060/2050/2070」を選択可能(TSUBAME2.0に搭載されているのはM2050)。

SL390sはある程度の規模での大規模演算を行いたいカスタマ向けのサーバとなっている

3枚のGPUの性能を最大限に引き出すために2つのIO Hub(IOH)を搭載。これにより、PCI Express(PCIe) Gen2×16バスを3GPUそれぞれに提供、CPU-GPU間通信の高速化を実現している。IOHが2つあるため、2GPUの場合はそれぞれのIOHに1枚ずつといった使い方をすることで、パフォーマンスを維持することも可能だ。また、Mellanox TechnologiesのInfiniband QDRおよび10GビットEthernet対応チップを始めから搭載しており、通信カードの追加なしで大規模システムでの高速通信も可能としている。

2つのIOHを搭載することで、各GPUにごとにPCIe ×16を確保

s6500シャーシの外観。標準19インチラックに搭載可能で、8つのホットプラグリダンダントファンや最大4つのホットプラグ80 PLUS Platinum認定の電源モジュールを搭載しており、1Uトレイで際ヂア8ノード、2Uトレイで最大4ノード搭載することができる

SL390sの外観。表面に見えるヒートシンクがGPUで、残りの1枚は一番右端から少し見えるが下の基板に挿さっている

HPがOEM供給を行うTesla Mシリーズ(写真はM2050)

これもSL390sだが、こちらは1Uバージョンのものとなっている

NECでは、SL390sとInfinibandスイッチ、そしてM2050を2枚セットし、数値計算ライブラリやOSのインストール、CUDAのインストール、CUDAのコンサルティング(コード分析)、GPU導入トレーニング(半日)の各種サービスをセットにした「GPUクラスタ スタータキットキャンペーン」も年度内いっぱい特別価格として550万円(税別)から提供するとしており、「小さなシステムで、まずはGPUコンピューティングを活用してもらいたい」(久光氏)とする。

東工大 学術国際情報センター 教授の青木尊之氏

なお、同会見にはTSUBAME2.0の開発にも関わってきた東京工業大学(東工大) 学術国際情報センター 教授の青木尊之氏も同席、「東工大としては、高い目標を持って、世界トップレベルのスパコンを導入しようと活動してきた。しかし、大学のスパコンであり、電力の問題やスペースの問題、そして予算も限りがあるという中で、我々が求める性能を実現できるシステムを導入してもらって感謝している」とNECと日本HPへの感謝の念を述べた。

TSUBAME2.0は10月に納入を終え、現時点ではLINPACKを実施中とのことで、2010年11月より稼働を予定している。利用は学内にとどまらず、学外、企業などにも開放する予定。「最近は海外、特に中国はGPUコンピューティングに力を入れている。Top500の2位、そして19位に中国のスパコンが入っている。日本は22位からということで、非常に脅威に感じている。GPUに関しても東工大としてノウハウを持ってはいるものの、激しく追い上げられていることは事実。TSUBAME2.0の稼働そして、今回の2社の協業により、日本でGPUコンピューティングを広め、日本のGPUコンピューティングを活性化させていきたい」と、日本がGPUコンピューティング分野で世界の先頭集団に立つことに向けた意気込みを見せてくれた。