IntelのメニーコアのKnightsシリーズプロセサは、「Xeon Phi(ジーオンファイ)」というブランドになることが発表された。しかし、製品としては、まだ、正式に発表されておらず、最初の製品となるKnights Cornerは50コア以上で各コアはx86アーキテクチャでSIMDベクターユニットを持つという程度の情報しか公表されていない。また、Xeon Phiのモデルナンバーも発表されていないので、この記事ではこれまでのKnights Cornerという名称を使ってその概要を読み解いていきたい。

2012年末の製品化を目指している「Intel Xeon Phi coprocessor(コードネーム:Knights Corner)」

今回のTop500では、ローレンスリバモア国立研究所のSequoiaが16.32PFlopsを達成して京を抜いてトップになったというのが一番のビッグニュースであるが、実は、IntelのKnights Cornerを使う「Discovery」という名称のシステムが150位にランクインしている。

このシステムは、Xeon E5-2670を2240コア(8コアであるので280チップ)とKnights Cornerを7560コア使用し、ピーク演算性能は180.992TFlopsとなっている。インタコネクトはFDRのInfiniBandを使い、システムの消費電力は100.8kWである。このシステムで、LINPACK 118.6TFlopsを叩き出してTop500の150位となっている。

Xeon E5-2670はクロックが2.6GHzであるので、コアあたりの倍精度浮動小数点演算性能は20.8GFlopsである。これが2240コアであるので、CPU部分のFlopsは46.592TFlopsとなる。すると、Knights Corner部は134.4TFlops、Knights CornerのコアあたりのFlopsは17.78GFlopsという計算になる。

また、Xeon E5が280チップであるので、1チップあたりのKnights Cornerコア数は27と計算される。Knights Cornerは50コア以上と発表されているので、Xeon E5の2ソケットのサーバに1個のKnights Cornerチップを付けた構成で、Knights Cornerチップに54コアを搭載というのが、一番、ありそうな構成である。

そうすると、Knight CornerチップのFlopsは17.78×54=960GFlopsと計算できる。Knights CornerのFlopsは1TFlops程度と見られていたので、この値は妥当な数字である。また、各コアは512bit幅の演算器を持ち、1サイクルあたり16演算を実行できると考えられ、17.78GFlopsということは、クロックは1.111GHzと計算される。メニーコアチップでは、クロック周波数を抑えて消費電力を下げるのが一般的であり、1GHzを若干超える程度のクロックというのも妥当な数字である。

また、100.8kWという消費電力は、Xeon E5-2670 2ソケットとKnights Corner 1ソケットからなるノードあたり720Wとなる。メモリの搭載量などが不明であるが、Xeon E5-2670のTDPは115Wであるので、Knights Cornerの消費電力は小さくなさそうである。

なお、この仕様は、Intel社内で動いているDiscoveryという試作的なスパコンのものであり、Knights Cornerが製品化されるときには、ある程度、異なる仕様になる可能性は残されている。

そして、Discoveryをスパコンとしてみると、ピーク性能の180.992TFlopsに対してLINPACKは118.6TFlopsであり、ピーク比率は65.5%である。この値はNVIDIAのFermi GPUを使うTSUBAME2.0などの50%前後の値に比べると高いものの、汎用CPUを使うシステムは80%以上、京は90%を超えているということから比べると低い値に留まっている。

一方、消費電力は100.8kWであり、エネルギー効率は1176.6W/Glopsである。この値は東工大のTSUBAME2.0の852.3W/GFlopsより高い。TSUBAME2.0に比べるとCPUも1世代新しくなり、NVIDIAのGPUは40nmプロセスで作られているのに対してKnights Cornerは22nmプロセスと低電力化が進んだチップとなっているので単純な比較はできないのであるが、まあ、マクロにみた感じではDiscoveryスパコンのピーク比率やエネルギー効率は、CPUにGPUアクセラレータを付けたシステムと近い性格をもっているように思われる。