Out-of-Order実行を行うコアを採用したM6プロセサ

Hot Chips 25においてOracleは、M6プロセサとそれを繋いで大規模サーバシステムを構成するBixbyチップを発表した。

OracleのSPARC M6プロセサを発表するAli Vahidsafa氏(左)とBixbyチップを発表するThomas Vicky氏(右)

OracleはTシリーズとMシリーズという2系統のSPARCサーバ製品を持っている。Tシリーズは、スループット重視のマシンで、小規模アプリを大量に走らせることを主眼にしたマシンである。一方、Mシリーズは大規模ビジネスアプリを走らせることを主眼に、シングルスレッド性能やスケーラビリティを重視したマシンである。

Oracleに買収される前のSun Microsystemsの時代にはスループット重視のサーバはSunが開発し、シングルスレッド性能重視のサーバは富士通が開発するという分担で協力してきたが、今年の3月に、Oracleは自社開発のM5マシンを発表し、大規模ビジネス分野にも自社システムの販売を進めてきた。今回発表のM6は、このM5をさらに強化したマシンである。なお、OracleはFujitsu M10シリーズという名称で、SPARC64 Xベースのサーバも販売も続けている。

これらのT5、M5もM6もプロセサコアとしては、すべてS3コアを使用している。SunのNiagaraプロセサに始まる一連のプロセサは、多スレッドをIn-Orderで実行する小規模コアを多く搭載するというスループット重視の設計であったが、S3コアは、シングルスレッド性能にも配慮したコアになっている。S3コアは、8スレッドの命令を切り替えながらフェッチし、毎サイクル2命令をイシューしてOut-of-Orderで実行するコアである。これまで、Sun/OracleのプロセサはIn-Order実行であり、S3コアは同社としては初のOut-of-Order実行を行うコアである。そして、S3コアは、それぞれ16KBのL1命令キャッシュ、L1データキャッシュと命令、データ共通の128KBのL2キャッシュを持っている。

富士通のSPARC64やIBMのPOWERのコアが4命令をイシューしてOut-of-Order実行するのに比べると、S3コアは2命令イシューであるので、実行ユニットの数も少なくて済む。ということで、S3コアはSun/Oracleとしてはシングルスレッド性能を大幅に高めたコアであるが、SPARC64やPOWERと比較すると、軽量コアで多スレッドサポートというスループット重視の側面も残っている。

2命令イシューのOut-of-Order実行を行うOracleのS3コアのブロック図

1チップ12コア、最大96ソケットまでサポート

T5プロセサは16コアと多数のコアを集積しているが、3次キャッシュは8MBと比較的小さく、最大8個のプロセサチップを直結するシステムとなっている。これに対して、M5プロセサはチップあたり6コアに抑えて、大容量の48MBの3次キャッシュを搭載し、最大32ソケットまで拡張したシステムを構成できるようになっている。

そして、今回Hot Chipsで発表されたM6は、2倍の12コアを1チップに搭載し、最大96ソケットまで拡張できるようになっている。

Oracleのプロセサの一覧

96ソケットのシステムでは、1152コアのマルチコアのキャッシュコヒーレントな共通メモリシステムとなり、各コアが8スレッドを実行できるので、システム全体では9216スレッドを実行できる、最大96TBのメモリを持つという巨大システムとなる。

M6プロセサは、次のスライドに示すように、12個のS3コアと48MBのL3キャッシュを集積している。そして、4つのDDR3コントローラを持ち、BoBと呼ぶバッファチップを経由して最大32枚のDIMMを接続できるようになっている。また、IOの接続用にx8のPCI Express 3.0を2チャンネル持っている。

マルチチップシステムを構成するコヒーレンスリンクを持ち、8ソケットまではグルーレス(直結)で接続でき、それより大きなシステムを作る場合は、後述のBixbyチップを使って、最大96ソケットのシステムが構成できるようになっている。

製造プロセスは、T5やM5と同じTSMCの28nmプロセスで、4.27Bトランジスタを集積する。これは富士通のSPARC64 X+の2.99Bトランジスタを上回り、多分、IBMのPOWER8をも超える最大の集積規模である。

Hot Chips 25ではM6プロセサのチップサイズは発表されなかったが、前身のM5はOracleの資料で511平方mmと発表されており、6個のコアが追加されていることから考えると、M6は600平方mm程度のチップと考えられる。このサイズはSPARC64 X+の600平方mmとほぼ同じサイズである。

SPARC M6プロセサの概要