AMD CPU
この5年間で、「Intelの有力な競合メーカー」から「ちょっと危ないCPUメーカー」まで没落してしまった感のあるAMD。それでもまだそれなりのプレセンスがあるのは、ATIを買収してGPUを手に入れ、これが比較的好調だから、という事になる。純粋に売上と粗利益だけを比較するとCPUやAPUを含むComputing Solution部門が圧倒的に大きいのだが、CPUはともかくAPUが競争力を保てている最大の理由はGPUコアが優秀(で、IntelのGPUが優秀ではない)からであり、その意味では2007年のATIの買収はやはり非常に賢明だったのだろうとは言える。
さてそのAMD、今はDiscrete向けにAMD FX、APUとしてAMD Aシリーズをそれぞれラインナップしているが、AMD FXですら競合製品はCore i5とか言っている状態なので、もはやEnthusiast向けとは到底言いがたい。なのでAMDは、「特にDiscrete GPUを複数枚挿すような環境、あるいはメディアエンコードなどのHigh Throughput Processingが必要な用途がAMD FX向け」としており、メインストリームのハイエンド~バリューは全部APUで賄う、という方向性を明確にしている。ということで、AMD FXとAPUについてそれぞれご紹介する。
AMD FX(表7・8)
鳴り物入りで登場する筈だったBulldozerアーキテクチャのAMD FXであるが、実際にはえらく遅れて2011年10月に最初の製品が投入された。性能面で色々話にならず、しかも消費電力がえらく高いという話は既にレポートしたから繰り返さない。
アーキテクチャ的に問題があった、というのは第三世代のSteamrollerを見ると良くわかる。Photo05がBulldozerとその後継のPiledriverのもの、Photo06がSteammrollerのものである。元々の発想は「Bulldozerの実行ユニットはThreadあたり平均して2命令/cycleで実行できるから、んじゃDecoderは4命令/cycleのものを一つ用意しておけば、2つのThreadを同時に処理するのに十分だよね」というものだ。これがSteamrollerでDecoderを分離したのは、要するに「やっぱり4命令/cycleだとデコーダの速度が足りなくて、実行ユニットが遊んでる」という事だと考えるのが一番妥当だろう。だからといって、Decoderを5命令/cycleや6命令/cycleに増やすのは回路規模が巨大になりすぎる。恐らくSteamrollerでは、それぞれ3命令/cycle程度のDecoderが各コアに設けられる形になり、これで実行ユニットの処理効率改善を図るものと思われる。逆に言えば現在のAMD FXは、かなり実行ユニットが遊んでいる状態で利用されていると思われる。なるほど、動作周波数の割に性能が伸びないのも納得である。
まぁこれはAMD FXにとっては比較的「明るい」面である。Steamrollerが登場すれば、性能がもう少し上がる可能性が見えているからだ。では「明るくない」面はどこか? というとプロセスである。AMDはAMD FXにGLOBALFOUNDRIESの32nm SOIプロセスを採用したが、この32nm SOIプロセスのYieldが恐ろしく低かったのは周知の事実である。もっとも下には下があるので、まだ「マシ」ではあったのだが、この32nm SOIプロセスが足を引っ張る形でAMD FXの流通量そのものが低く抑えられてしまったため、そうでなくても性能面でハンデがある上に買いにくい、という事で結果としてDesktopにおけるAMD FXのシェアはお話にならない程度でしかなかった。
これが幾分なりとも解消したのは2012年10月のVisheraコアの投入である。基本的な性能改善は殆ど無いながらも、動作周波数はやや上まで引っ張れるようになり、また同じ動作周波数ならば消費電力が下がった。価格にしても、ハイエンドのはずのAMD FX-8350が17000円未満(2012/12/28・Amazon調べ)という有様で、これは非常に買いやすい。Yieldに関しては流石に1年継続しただけのことはあり、後述のTrinityも含めて比較的流通量も多く、やっと32nm SOIも軌道に乗ったという感じがある。
ということで話が現在に戻ってきたところで、問題はこれからの話である。AMDは次のSteamrollerコアを28nmプロセスで製造すると以前から発表している。で、AMDは公式には「どこのファウンダリを使うか」を明確にはしていないが、当初はGLOBALFOUNDRIESの28nmの予定だった。
なんで過去形かというと、このGLOBALFOUNDRIESの28nmプロセスがひどいことになっているからだ。元々AMDは、Bobcatベースの第二世代製品であるWichita/KrishnaをGLOBALFOUNDRIESの28nmプロセスで製造する予定だった。が、まともに動くダイが取れないという凄まじい状況になり、結局これをキャンセルする。AMDはこのBobcat系列の製造先をTSMCに切り替えるが、昔はともかく最近ではファウンダリを換える、という作業は非常に困難である。要するに配置配線からやり直しという話だが、トランジスタの特性なども全部異なるから、CPUとかAPUの様に複雑な回路になると、これに年単位の期間が掛かる。従ってAMDは2012年にBobcatの後継コアとなる製品を投入できず、やむなくBrazos 2.0という形で初代Bobcatのマイナーアップデート版を投入して無理やり繋ぐ羽目になった。
どうもこの時点で、AMDとしても「全部GLOBALFOUNDRIES頼みにするのは危険だ」と判断したようで、APU系列はTSMCの量産に切り替えたものの、もしTSMCの28nmに何かあったらこっちはこっちで問題になるので、リスク分散の意味でAMD FXはGLOBALFOUNDRIESのままということにしたようだ。
さて、そのWichita/Krishnaのキャンセルからほぼ1年であるが、この間にGLOBALFOUNDRIESからまともに出た28nmプロセスの製品はほぼゼロである。AMD以外のメーカーもやはりGLOBALFOUNDRIESの28nmプロセスを使って製造を行ったのだが、Yieldが0(全量アウト)という恐ろしい状況だったそうだ。これはTSMCの40nmプロセスを使っての量産に失敗したNVIDIAのGeForce GTX 480よりも状況が悪い。それも一社ではなく複数社でそういう状況になったそうだから、設計というよりはプロセスの問題の公算は非常に高い。
実際GLOBALFOUNDRIESの28nmプロセスで動作したものとして筆者が知っているのは、Cortex-A9ベースのTQV(Technical Qualification Vehicle:技術検証用のテストベッド)が2.5GHzで駆動した事程度でしかない。要するに小規模な回路を、メーカーがフルにチェックしながら製造する分には一応動くのだが、大規模な回路を普通に委託を受けて製造すると駄目、というのが現状であろうと思われる。この結果として、SteamrollerをGLOBALFOUNDRIESの28nmで製造するのは非現実的な状況になっている。
AMDのオプションとしては3つある。1つ目はGLOBALFOUNDRIESともっと緊密にタッグを組んで、ちゃんと28nmが量産できるようにする。2つ目はTSMCに乗り換える。3つ目は同じGLOBALFOUNDRIESの32nm SOCに戻す、である。3つ目はちょっと説明が必要だろう。元々GLOBALDOUNDRIESは28nmプロセスについて、EDAツールのいくらかを32nm SOIのものと共用している。なので、もし作り直すとしても全部が全部やり直す必要が無い分、多少期間は短くなる。
ただ現実問題として1つ目を実行できるような体力と期間を今のAMDは持ち合わせていないし、3つ目の選択肢は製品こそ完成するかもしれないが、性能面でビハインドを負う事になる。SteamrollerはZambezi/Visheraと比較して明らかに回路規模が増えるから、ダイサイズが更に増すことになる。AMDとしてはSteamroller世代で、可能ならもう少しCore/Moduleを増やしたいと画策していたから、プロセスを戻すという選択肢は論外である。となると結論は2番目しかないが、今度は物理設計のやり直しが入ることになる。現状、まだSteamrollerがTapeoutしたという話は全くなく、むしろdelayしただのslipしただのという話しか聞こえてこないあたり、現在も物理設計の真っ最中であろうと想像される。
ということで話がやっと戻ってきたが、今のままだとSteamrollerベースのAMD FXが2013年中にリリースされる公算は限りなく低い、と言わざるを得ない。一応表7には2013年12月に入れておいたが、まぁ出てこないほうに一票である。つまりAMD FXのラインナップは2013年中もVisheraベースのままで推移することになるだろう。これがAMD FXにとっての「明るくない」面である。
僅かながらの救いは、まだVisheraコアに若干のマージンがありそうに見えることだろう。Zambeziの時には、むりやり3.9GHz/4.5GHzまで動作周波数を引っ張り上げたFX-8170を、TDP 140W枠でリリースするなんて計画が流れていたが、色々無茶ということでキャンセルになった経緯があるが、Visheraコアなら4.2GHz/4.5GHzあたりまで引っ張るのはそれほど難しくないだろう。まぁ焼け石に水、という感もあるのでやらない公算が高いが。