Hot Chips 29においてAMDのEPYCプロセサを発表するKevin Lepak氏

AMDはHot Chips 29において、 Zenアーキテクチャコアを使うサーバ向けのEPYCプロセサを発表した。EPYCはCPUコアが32個、DDR4メモリチャネルが8チャネル、PCI Express(PCIe)が128レーンと、物量、性能でIntelのXeonをしのぎ、それでいて、お値段はIntelの対抗製品より若干安いというIntelキラーのサーバプロセサである。

EPYCの主要なアピールポイントをまとめたのが次のスライドである。AMDの新設計のZenコアを使い、メモリ暗号化などセキュリティも強化されている。また、MCMを使い4個のプロセサチップを1パッケージに収容しており、32CPUコア、ソケット当たり16DIMM接続など強力なメモリチャネル、IO接続をサポートする。

EPYCはZenコアを使用し、CPU性能、仮想化、RAS、セキュリティなどの機能が強化されている。また、16DIMM接続とメモリインタフェースやIO接続も強力である (このレポートのすべての図は、Hot Chips 29におけるAMDのLepak氏の発表スライドのコピーである)

ZenコアはAMDの以前のプロセサと比較して52%以上IPC(Instruction per Cycle)を改善しているという。なお、この52%はAMDのPiledriverコアとの比較である。AMDは昨年のHot Chips 28でZenコアについて発表しており、その時は、直前の世代となるExcavatorコアと比較して40%のIPC向上と言っていたのであるが、今回の発表では基準をもう少し前のPiledriverコアに替えて52%という数字を出している。

EPYCではコアの設計をイチからやり直し、キャッシュのバンド幅やレーテンシを改善して性能を上げ、SMTをサポートしたことでスループットを向上している。

Zenコアは、AMDの以前のプロセサであるPiledriverコアと比較してIPCが52%以上高い

EPYCがIntelプロセサと大きく異なるのは、パッケージングである。EPYCは4チップをMCMに搭載し、それらを相互接続している。したがって、32コア、8DIMMチャネル、128レーンPCI Expressと言っても、1チップで見れば8コア、2DIMMチャネル、32PCI Expressレーンで、普通のプロセサである。

しかし、Infinity Fabricという4本の高速リンクでこれらの4個のチップをキャッシュコヒーレントに接続し、1チップのプロセサとほぼ同じように動作するようにしている点が頑張っている点である。

なお、このCPUチップは、AMDの開発コードネームを「Zeppelin」という。余談であるが、毎年、Hot Chipsにあわせて昔の仕事仲間と再会してビールを飲む集まりを催しているが、今年は、一人の参加者がZeppelin飛行船が描かれたAMDの開発チームのTシャツを着て来ていた。

EPYCはMCMに4チップを搭載するという実装になっている。各チップからは、2つのDIMMチャネル、2チャネルの16レーンの高速SERDESを出し、このチップを4個、キャッシュコヒーレントなリンクで相互接続している

AMDはMCMの使用はメリットが多いという。一番のメリットはチップ歩留まりの向上である。第二のメリットは、1チップの場合よりも機能を向上できる点で、これはEPYCのコア数、メモリチャネル数などをみても明らかである。

EPYCのZeppelinチップのサイズは213mm2で、4個を搭載するには852mm2のシリコンインタポーザが必要になる。一方、4チップ分をまとめて1チップ化すると777mm2程度にでき、サイズは10%程度小さくなるが、歩留まりはチップサイズの指数関数の逆数で低下するので、777mm2のチップは213mm2チップに比べて歩留まりがかなり低くなってしまう。結果として、全部を1チップ化する場合に対して、4チップをMCMに搭載する実装により、0.59倍のコストで製造できるという。

MCMに4チップ搭載するEPYCの実装は、全部を1チップ化する実装に比べて0.59倍のコストで製造することができる