AMDのロードマップを講演する林淳二氏

2015年2月20日に大阪で開催されたPCクラスタコンソーシアムの「PCクラスタワークショップin大阪2015」において、AMDの林淳二氏が「AMDコアのイノベーション "Ambidextrous Computing" ロードマップとその後」と題する講演を行った。

2014年10月にLisa Su氏がCEO兼社長になり、AMDは生まれ変わりつつあるという。具体的には、従来のPCビジネスの維持、デスクトップなどのグラフィックス分野に加えて、高密度型サーバ、超低消費電力型クライアント、企業向けグラフィックス、組込み型ビジネス(PS4やXboxなどのゲーム機用プロセサ)、セミカスタムといった成長マーケットを攻める。

昨年10月にLisa Su氏が社長になり、重点的に成長市場を攻める戦略に変わった。具体的には、高密度サーバ、超低消費電力クライアント、企業向けグラフィックス、組込型ビジネス、セミカスタムの分野に力を注ぐ

AMDは従来のx86コアに加えて、ARMコアを使う「Seattle」を開発し、"Ambidextrous Computing"と称する戦略を取ってきた。Ambidextrousとは「右利き」とかでなく「両手が使える」という意味で、日本語では、二刀流と訳している。

2014年は、x86コアを使う「Kaveri APU」やサーバ用の「Berlin」とARMコアのサーバ用 CPUであるSeattleを提供し、ユーザが選べるというレベルであったが、2015年にはそれを進めて、x86 CPUとARM CPUをソケット互換にする。

AMDはx86とARMの両方のコアを持ち、二刀流の戦略を取ってきたが、2015年には、それを進めてピン互換なx86 CPUとARM CPUを作る

エンドユーザがx86からARM、あるいはその逆にCPUチップを差し替えることは、あまり無いと思われるが、マザーボードやサーバを作っている会社にとっては、同じマザーボードで、CPUの差し替えとBIOS ROMの変更程度で、x86とARMの2種類の製品が作れることはメリットであろうと思われる。

この2015年の世代では、x86は「Puma+コア」、ARMは低電力の「Cortex-A57コア」を搭載するが、AMDのGCNグラフィックスを搭載し完全なHSAサポートなどコア以外の部分は共通設計にして行く。

ARMコアに関しては、2014年はARMのCortex-A57をSeattleに組み込んだが、2015年には、x86コアとARMコア以外の部分の共通化を行う設計メソドロジーを確立し、低電力のA57コアを開発する。そして、2016年にはAMDの独自設計のK12というARMアーキテクチャのコアを開発する。このコアはA57と比較すると、何倍もの性能を持つという。

ARMコアのロードマップ。2015年はARM Cortex-A57コアの低電力化を行い、x86との共通設計のメソドロジーの評価を行い、2016年にはK12という独自設計のARMコアを開発する

このK12コアの時代には、x86コアのチップもK12コアのARMチップもメニーコア、メニースレッドを並列実行するチップになるとのことであった。現在、HP Moonshotサーバのm700カートリッジに採用されているX2150 APUは4コアのKabiniであるが、将来の高密度サーバにはこのチップを使うのであろう。

グラフィックス分野では、2012年に「Tahiti」、2014年に「Hawaii」を開発してきたが、今後も2年置きに新しいグラフィックスチップ(dGPU:discrete GPU)を開発して行く。そして、その次の奇数年にそれをAPUに組み込むというサイクルを続けて行く。その結果、2019年のAPUは数TFlopsの演算性能を持つことになるという。

GPUとAPUのロードマップ。2012年のTahiti、2014年のHawaiiに続いて2年ごとに新しいGPUを開発し、奇数年には、それをAPUに組み込む。2019年のAPUは複数TFlopsの演算性能を持つという計画である

例えばHawaiiの最上位GPUは44GCNコア(CU)を搭載しているが、APUであるKaveriは8GCNコアしか搭載できていない。これは消費電力やチップ面積の制約があるからであるが、サーバ用チップのCPUコア部分とハイエンドGPUのグラフィックス部分を容易に合体できるようにして、ハイエンドのHPC向けのAPUを作る計画である。消費電力は200-300Wと大きくなるが、性能は高く、スパコンなどではメリットがあると見ている。

ディスクリートのGPUとサーバ用CPUが出来たら、それを容易に合体できるように設計し、ハイエンドGPUを組み込んだHPC用のGPUを作る

AMDのGPUは、NVIDIAのGPUと比較して、単精度の演算で17%、倍精度の演算では77%性能が高い。そして消費電力は同じ235Wであるので、性能/Wも高い。加えて、1ドルあたりの演算性能も2倍以上高く、メモリ量、メモリバンド幅でもK40を凌駕している。AMDは、今後も、この優位を維持して行く計画であるという。

NVIDIAのK40とAMDのS9150 GPUの諸元の比較。演算性能、性能/W、コストパフォーマンスなどの点で、S9150の方が優位に立っている

Omni Pathをパッケージレベルで集積するというIntelの講演の直後の発表であり、出席者から、Sea MicroのFreedom Fabricインタコネクトを集積するという話が以前にあったが、どうなっているのかという質問が出た。それに対しては、現在ではPCI Expressで汎用のネットワークインタフェースを付けるという方向で、Freedom Fabricを集積するという話は進んでいないという回答であった。