AMDは7月、同社の最新GPU「Radeon RXシリーズ」についての記者説明会を開催した。米国AMD本社からコンシューマー向けGPU製品担当者が来日し、製品のコンセプトやアーキテクチャの詳細について説明した。
Radeon RXシリーズは、AMDが2016年6月のCOMPUTEX TAIPEI 2016で発表した最新GPUで、新アーキテクチャ"Polaris"に基づく製品となる。すでに現行の最上位モデル「Radeon RX 480」は販売を開始しており、弊誌でも大原雄介氏によるレビューをお届けしている。また、近日中に下位モデルとなる「Radeon RX 470」や「Radeon RX 460」も登場する予定だ。
・Radeon RX 480ファーストインプレッション - 期待の"Polaris"のパフォーマンスを探る
・Radeon RX 480徹底検証 - 2枚のRadeon RX 480は本当にGeForce GTX 1080より早いのか?
大多数のユーザーに向けた製品を投入し、シェア拡大を狙う
Korhan Erenben氏 |
"Polaris"とRadeon RXシリーズのターゲットは明確で、それはメインストリームに注力するということだ。大原氏が実施したベンチマークテストでも、Radeon RX 480はGeForce GTX 970と同様、あるいはそれを上回る性能となっている。また、AMD自身も同社の公式Facebookにて開催した"Ask Me Anything"キャンペーンでも「RX480とGTX1070/1080は、まったく異なるマーケットセグメント」とコメントしている。
説明会に参加したRadeon Technologies Groupでコンシューマー向けGPU製品を担当しているKorhan Erenben氏によると、PCゲーマーの84%が100ドル~300ドルというレンジのグラフィックスカードを購入しているという。さらに、Steamのハードウェア調査からユーザーの95%がフルHD(1920×1080ドット:1080p)以下の解像度でゲームをプレイしていると紹介した。
また、昨今話題のVRについても全世界に存在する14.3億台のPCのうち、VRに対応しているものは1,300万台とおよそ1%に過ぎないという。つまり4KだVRだとハイエンドの領域が注目されがちだが、ユーザーの規模で考えるとその領域はほんのわずかだ。"Polaris"ではその領域を狙うのではなく、大多数のゲーマーに向けて製品を提供し、シェアの拡大を狙う。
"Polaris"世代では、現状"Polaris 10"と"Polaris 11"という2つのコアが公開されている。Radeon RXシリーズのうち、「Radeon RX 480」と「Radeon RX 470」は"Polaris 10"、「Radeon RX 460」は"Polaris 11"をベースにしている。
「Radeon RX 480」は2,560×1,440ドット(1440p)といった1080p以上の解像度におけるゲームプレイやVR、「Radeon RX 470」は1080pにおいて、より高画質設定でのゲームプレイ、「Radeon RX 460」はLeague of LegendsやDOTA 2といったメインストリームのeスポーツタイトル向けといった形でそれぞれ位置付けられている。フルHDでのゲームプレイをこれまでよりも豊かに、あるいはミドルレンジ領域までVRの市場を広げるといった課題に応えていく。
それでは「AMDはもうハイエンド領域の製品を出さないのか?」というとそうではない。Erenben氏が示したAMDのGPUロードマップによると、2016年の"Polaris"につづいて、2017年前半には"Vega"が予定されている。ここで再びハイエンドGPUを投入するという。AMDは2016年末に新CPUコア「Zen」を採用したCPU"Summit Ridge"を出荷する予定だ。2016年末から2017年前半にかけて、CPUとGPUともにハイエンド製品がお目見えすることになりそうだ。
大きくワットパフォーマンスを改善した"Polaris"
製品の立ち位置については以上だが、説明会では"Polaris"のアーキテクチャについても解説があった。とはいっても、本間文氏によるレポートと重なる部分はあるが、おさらいもかねて紹介したい。
"Polaris"はさまざまなアップデートが盛り込まれたGPUだ。製造プロセスはGLOBAL FOUNDRIESの14nm FinFETプロセスに微細化。AMD GPUの核となるGCN(Graphics Core Next)の世代も刷新し、第4世代となった。
第4世代GCNでは、まずジオメトリエンジンが強化されている。演算処理の早い段階で、重ね合わせなどの結果、オブジェクトやエリアが0になるような部分のレンダリングを省略することで処理を高速化する「Primitive Discard Accelerator」に加え、小さなインスタンシングデータのためのインデックスキャッシュを追加し、ジオメトリ処理の効率を高めた。
また、Compute Unit(CU)は、FP16/Int16のサポートをはじめとするさまざまな変更により、CUあたりの効率を15%高めほか、オンメモリの容量増加やL2キャッシュのチューニングなども施されている。
メモリはコントローラを刷新し、最大8GbpsのGDDR5メモリのサポートを可能とする。さらに2分の1、4分の1、8分の1レシオによるデルタカラー圧縮機能により、メモリ効率が向上。Radeon RX 480はメモリインタフェースは256bitと旧モデルのRadeon R9 290と比べると小さく、帯域も下がっているが、このメモリ効率化により、同等以上の性能が得られるとしている。
そして、AMDがかねてよりアピールするのが「Asynchronous Compute」への対応だ。Asynchronous ComputeはDirectX12でサポートされた機能の1つ。グラフィックス関連の処理に加えて、オーディオの処理や物理演算といったCompute側の処理を同時に行うことで、GPUの利用率を向上させる。AMDはVRにおいてAsynchronous Computeが非常に重要になると位置付けている。
Erenben氏によると、ある処理を中断して別の処理を割り込ませる「プリエンプション」では、代表的なVRヘッドセットで要求される90フレームに処理が間に合わない可能性があるという。一方でハードウェア的にAsynchronous Computeをサポートしている場合、グラフィックスとComputeの処理を同時に行うことで、処理にかかる時間を短縮できるとする。
さらに"Polaris"世代のGPUでは「Quick Response Queue」という機能を新たに実装。常にグラフィックス側のワークロード向けて、10%~20%のGPUリソースを保持し、Compute側の処理→グラフィックス側の処理という順番で処理を完了する。「Computeの処理が終わる前にフレームがレンダリングされてしまうと、例えば物理演算によるビジュアルエフェクトが抜けてしまい、没入間をそこねてしまう。Quick Response Queueによってこうした問題に対処できる」(Erenben氏)
一番上の図がプリエンプション、真ん中の図が従来のAsync shaderでの処理。新たにサポートする「Quick Response Queue」では、GPUリソースの一部を保持するように割り当てることができる |
以上のような取り組みの結果、28nmプロセスから14nm FinFETプロセスへの移行で1.7倍、さらにアーキテクチャの改良や新技術の採用で2.8倍のワットパフォーマンスを実現したという。