エクサスケールスパコンの開発プランを発表するPEZYの齊藤社長

早稲田大学(早大)で開催されたSISA(A Strategic Initiative of Computing: System and Applications)ワークショップにおいて、PEZYの齊藤元章社長が「Plan to develop ExaScale computing system」と題する講演を行った。サブタイトルに「with Proprietary Processor、DRAM and Cooling technology」と付いており、従来のPEZY-SC系のプロセサと浸漬液冷に加えてDRAMもカスタム開発するという。

PEZYは、次の図に示すように。現在、6台のスパコンを稼働させており、理化学研究所(理研)に設置された菖蒲スパコンは2016年6月のGreen500では1位、Top500でも93位にランクインするという実績をもっている。

PEZYは6システムのZettaScaler-1.xスパコンを稼働させている (このレポートのすべての図は、SISAワークショップにおけるPEZYの齊藤社長の発表スライドのコピーである)

PEZYグループは、次の図に示す5つの会社からなっている。最初に作られた会社がPEZY ComputingでメニーコアのPEZY-SCプロセサを開発している。2番目が、慶應義塾大学の黒田忠広教授が考案したThrough Chip Interface(TCI)という磁界結合で信号をやり取りする技術を使う3D積層DRAMを開発するUltra Memory。そして、液浸冷却技術を開発し、スパコンシステムを開発するExaScalerを創立している。つまり、カスタムのプロセサ、DRAM、冷却を使うスパコンというのは、当初から齊藤社長の頭の中にあった戦略である。

そして2016年の5月にDeep InsightsとInfinite Curationという会社を作っている。これらは1000倍速いAIエンジンと,それを使って遺伝子解析、創薬などを行うことを目的とする会社である。

スパコン関係の3社で従業員は88名、最近創立のAI関係の2社は、合計で10名であり、全部合計しても100名に満たない所帯である。

PEZYグループは5社で構成されている。最近設立されたAI関係の2社を加えても100名に満たない少数精鋭である

PEZYの開発目標は非常にアグレッシブである。次の図は、開発中のPEZY-SC2プロセサに4個のTCI DRAMを接続したモジュールのモックアップで、TCI DRAMのメモリバンド幅は512GB/sとなっている。4個のTCI DRAMを搭載するこのモジュールのバンド幅は2TB/sとなり、これはNVIDIAのHBM2 ×4個の約3倍のメモリバンド幅となる。

PEZY-SC2と4個のTCI-3D DRAMを搭載するモジュールのモックアップ

次の図は、よく見るTop500の性能推移をプロットした図で、一番下のラインが500位のスパコンの性能、その上が1位のスパコンの性能である。そして一番上は1位から500位までの全スパコンの合計の性能である。

これに対して、青字で書いたようにZettaScaler-1.0からZettaScaler-3.5システムの性能を向上させて行くというのが、PEZYグループの計画である。この図に見られるように、ZettaScaler-3.0ではExaFlopsを超え、Top500の1位の性能ラインを上回るという計画になっている。

2018年頃には、ZettaScaler-3.0でExaFlopsを超えるというPEZYの計画

このアグレッシブなロードマップを実現するため、PEZYは次のようなプロセサの開発計画を持っている。

現在開発中の16nmプロセスを使用するPEZY-SC2メニーコアプロセサは2048コアを集積し、1GHzクロックで動作する。倍精度浮動小数点演算のピーク性能は4.1TFlopsである。そして、TCI DRAMを使うメモリのバンド幅は2.1TB/sで、Green500のスコアとして15GFlops/Wを目指している。

そして、7nmプロセスを使用して8192コアを集積するPEZY-SC3、5nmプロセスを使用して16384コアを集積するPEZY-SC4を開発して、このロードマップを実現していく考えである。

現在の28nmのPEZY-SCから、SC2、SC3、SC4に至るプロセサのロードマップ

次の図の写真は、ZettaScaler-1.6の液浸槽と屋外に設置された熱交換器であるが、上記のロードマップのメニーコアプロセサを使い、ZettaScaler-1.6と同じサイズの液浸槽で、2017年のZettaScaler-2.0では1.5PFlops/液浸槽と性能を6倍に引き上げる。そして2018年にはZettaScaler-3.0で8PFlops/液浸槽と32倍に性能を引き上げ、2020年のZettaScaler-4.0では20PFlops/液浸槽と80倍に性能を引き上げる計画である。

ZettaScalerスパコンのロードマップ

次の図のタイトルは、2019年にZettaScaler-3.0システムで1ExaFlopsを超えると書かれているが、もう1つ、重要な点は、2017年に20-30PFlopsのシステムを稼働させると書かれていることである。

2019年のZettaScaler-3.0で1ExaFlopsを超える。また、2017年に20-30PFlopsのスパコンを完成すると書かれている

そして、PEZY-SC4になると1チップで50TFlopsとなり、京コンピュータの100倍の性能が50ラックに収容できることになる。

2020年には5nmプロセスを使うPEZY-SC4で1ExaFlopsを目指す

PEZY-SC3、SC4は夢のある話であるが、テープアウト間近というPEZY-SC2はより具体性の高い話である。そのPEZY-SC2を使ってZettaScaler-2.0システムを作り、2017年に20-30PFlopsのシステムを動かすと発表したことが注目される。この性能は、現在、国内トップの東大-筑波大のOakforest-PACSと同程度の性能レンジであり、場合によっては国内トップに躍り出る可能性もある。

この話に関連してSISAワークショップの直後の1月20日に、科学技術振興機構(JST)から、産学共同実用化開発事業(NexTEP)未来創造ベンチャータイプの平成28年度緊急募集における新規課題に採択されたという発表が行われた。

JSTの課題の開発には、1億円~最大50億円の開発費が支出される。ただし、これは貸付で、開発が成功した場合は、全額返済する必要がある資金である。一方、開発が失敗した場合は90%は返済が免除され、10%だけを返済すれば良い。まず、多額の開発費が手に入り、開発失敗の場合のリスクも大幅に軽減されるので、資金繰りの厳しいベンチャー企業にはありがたい助成措置である。

PEZYの課題は「磁界結合DRAM・インタフェースを用いた大規模省電力スーパーコンピュータ」となっており、代表研究者は慶応大の黒田教授で、開発実施企業がExaScalerとなっている。JSTに問い合わせたところ、PEZY-SC2や磁界結合の3D DRAMの開発だけでなく、スパコンの開発も課題に含まれているとのことである。つまり、20-30PFlopsのスパコンの開発費の調達にめどを付けたと考えられる。また、JSTの回答では、このスパコンは海洋研究開発機構(JAMSTEC)に設置される方向で検討がなされているとのことである。JAMSTECは地球シミュレータを持つ研究所であるが、NECのSX-ACEスパコンを使う現在の地球シミュレータは、ピーク演算性能は1.3PFlopsであるので、このExaScalerのスパコンが入ると、大幅に演算性能を向上することになるが、JAMSTECに対してどういう契約形態で設置され、運用されるのかは明らかではない。

しかし、JSTの課題の開発期間は2017年1月から12月となっているので、今年末には完成するということになる。