(前編はコチラ)

(中編はコチラ)

チップの物理設計

チップは28nmプロセスで製造され、25.2mm×25.38mmと巨大である。電源電圧0.9Vで、クロックは2GHz、消費電力は120Wとなっている。パッケージはおおよそ3000ピンのFCBGAである。

Marsチップは、中央に4列2段にパネルが配置され、4辺に2個ずつのMIUが配置され、ここからCMCチップに接続される。そして、I/Oを接続するIOU(PCIe3.0 x16相当)が上辺の左側と下辺の右側に配置されている。

チップのレイアウト図にはMarsチップ間を接続するリンクらしきものは無いので、このチップでは、マルチソケットのシステム構成はサポートされていないのではないかと思われる。

28nmプロセスで製造され、チップサイズは25.2mm×25.38mm。クロックは2GHzで、消費電力は120W。パッケージはおおよそ3000ピンのFCBGA

Marsシステムの性能

この重装備のXiaomiコアを64個搭載するMarsチップの性能であるが、SPEC_CINT2006_baseベンチマーク性能は19.2、CFP2006_baseの性能は17.8となっている。しかし、2.30GHzクロックのIntel Xeon E5-2699 v3を使うHPのProLiant BL460c Gen9のCINT2006_baseのスコアは65.1、CFP2006_baseのスコアは103であるのと比較すると、非常に性能が低い。

また、CINT2006_rateのスコアは672、CFP2006_rateは585となっている。HPのProLiant BL460c Gen9は18コアでCINT2006_rateは685、CFP2006_rateは459であり、Marsは64コアをつぎ込んでもCINTでは多少遅く、CFPでは3割弱速いという結果であり、64コアの割にはあまり高性能とは言えない。

ただし、HPの結果は実機でチューニングを行った結果であるのに対して、Phytiumの方はまだ実機がなくシミュレータでの性能測定であるので、コンパイラなどのチューニングはほとんど出来ていないと思われ、公平な比較ではない面がある。

MarsシステムのSPECベンチマークの性能

次の図はStreamベンチマークでのメモリバンド幅の測定であるが、64コアで83GB/s程度の値となっている。ピークバンド幅は204GB/sであるので、ピークの40%程度しか出ていないという結果になっている。これはCMCの実効メモリバンド幅が、ピーク値と比べると読み出しでは1/2、書き込みでは1/4のバンド幅しか出ていないことが主因であると思われる。

Stream TriadによるMarsシステムのメモリバンド幅測定結果

まとめ

全体としてみると、Xiaomiコアは重装備の高性能コアの造りになっているが、SPECベンチマークやStreamベンチマークの結果は、それほど高くはなっていない。しかし、Marsチップは、まだ、テープアウトされていない状態なので、十分なチューニングを行ったとは考えられないので、今後スコアが伸びる可能性は残っている。

実機のシステムが完成し、ターゲットとなるアプリケーションで性能が出るかどうかが鍵である。

最後に、Xiaomiコアという名称であるが、Xiaomi(小米)は中国の有名なスマホメーカーである。その名前がついているというのは、XiaomiがPhytiumの後ろについているのではないかという想像が成り立つ。ARMv8のアーキテクチャライセンスを受けて高性能プロセサチップを開発するとなると、少なくても5000万ドル、ないしは1億ドル程度の開発費が必要になると考えられ、小さな会社が容易に賄える金額ではない。どこか資金の豊富なバックが付いていると考えるのは当然である。しかし、確たる証拠があるわけではなく、これは筆者の想像である。