Hot Chips 25において、AMDのPraveen Dongara氏がハイエンドAPUのRichlandを発表した。

Richlandを発表するAMDのPraveen Dongara氏

Richlandは建設機械シリーズ第2世代のPiledriverコアを使い、AMDのAPUの中ではハイエンドの分野をカバーする製品である。

Richlandの主要な特徴

Richlandの主な特徴であるが、前世代の「Trinity」と比較して、CPU性能は最大29%向上し、GPU性能は最大41%向上しているという。そして、Webブラウジングで7時間以上とバッテリライフも改善している。さらに、AMD Start Nowテクノロジで、S3、S4ステートからの回復時間も短縮している。

また、メディア関係では、ワイヤレスディスプレイのサポートを行い、HDビデオのプレイバックの電力を51%削減している。

Richlandは次の図の左側に小さな字で書かれているように、プロセサとしては、デュアルコアのPiledrverに2MBのL2キャッシュをつけたモジュールが2個搭載されており、それにRadeon HD8000グラフィックスと次世代メディアエンジン、DDR3-2133インタフェースが2チャネル、PCI Express2.0などがサポートされている。

しかし、AMDは昨年のHot Chips 24でTrinityを発表している。実は、TrinityもRichlandもプロセスは32nm SOIプロセスで、Piledriverデュアルコア+2MBキャッシュを2組、GPUも同じである。このため、Hot Chips 25でのDongara氏の発表は、Richlandで改良されたターボコアテクノロジに焦点をあてた発表であった。前世代のTrinityも同じPiledriverコアであり、前述の最大29%のCPU性能向上は、主に、チューニングとターボコアテクノロジの改善で達成されたものと思われる。

次の図のように、Richlandには、2つのCPUモジュールとグラフィックスコアとマルチメディア、ノースブリッジを一まとめにしたものという3つの主要な発熱部(Thermal Entity:TE)がある。

Richlandでは、それぞれのTEについて消費電力と温度をモニタし、電源電圧とクロック周波数をコントロールしている

Richlandでは、それぞれのTEについて消費電力と温度をモニタし、電源電圧とクロック周波数をコントロールしている。また、これらのTE以外にもI/Oの消費電力の影響も考慮している。

各TEの消費電力は、内部の主要部分ごとに動作率をモニタし、それにトランジスタ数や配線長などから決まる重みを掛けて等価的な容量Cacを求めて、それに電源電圧Vの2乗とクロックFをかけてアクティブな電力を求め、さらに電源電圧と温度をパラメタとするリーク電力を加えるという方法で計算する。

各TEのアクティブな消費電力を、動作率と重みをかけた等価的なCacと電源電圧V、クロックFから計算し、さらにリーク電力を加えて計算する

チップには熱抵抗や熱容量があるので、発熱イコール温度とはならない。チップの熱抵抗や熱容量をRC回路に置き換えて、回路解析の要領で、TEの消費電力に対して、各部の温度がどうなるかを計算する。

熱抵抗や熱容量をRC回路に置き換えて、各部の温度上昇を計算する

そして、温度が上限より低ければ、クロックと電源電圧を上げる高速のP-Stateに移行し、上限温度を超えそうであれば、クロックと電源電圧を下げる低速のP-Stateに移行する。

このコントロールループが3つのTEそれぞれに存在する。

電力計算から温度計算を行い、TEのP-Stateを制御するループ。各TEにループがある

また、P-Stateの移行にはコアの電源電流のリミットやその他のリミットもチェックされ、温度が低いからといっていくらでも高速に動作する状態になるわけではない。

そして、Richlandでは、これらのTrinityの電力制御機構に下記の図の4つのエンハンスメントを加えている。

Richlandで拡充されたターボコア機能

「Temperature Smart AMD Turbo CORE」は、チップ温度の計算にTE各部の温度センサのデータを加えて、気温が低いなどでチップ温度が低い場合には、より多くのクロック周波数のブーストを行う。

チップには決められたTDPがあるが、装置を小型化したい場合などは、この消費電力では冷却が出来ない場合も出てくる。このような場合に、TDPを引き下げるのが「cTDP(Configurable TDP)」という機能である。TDPを下げると、気温が高い場合などはクロックの上限が下がってしまうことがあるが、チップが過熱して破損することは防止できる。

「Additional Boost State」は、通常のブーストは2状態であるが、これを3状態に拡張して、よりきめ細かい制御を可能にする。

3つのTEで制御系は独立しているので、例えば2つのCPU TEがブーストで電力を使ってしまい、電力不足でGPUが割を食うということが起こり得る。「Intelligent Boost」は、GPUのアクティビティをモニタし、かつ、CPUで動作しているアプリケーションのクロック周波数に対する性能の依存性が小さいことを検出すると、CPUの電力をGPUにまわして、システム全体の電力効率を改善する。

Intelligent Boostは、CPUで動いているアプリの性能がCPUクロックにあまり依存しない場合は、GPUに電力をまわして、チップ全体の効率を改善する

これらの改善により、次の図に示すように、Richlandの消費電力は前世代のTrinity APUから低減している。ただし、大きく電力が減っているのは、720pのビデオプレイバックのケースであり、これは新しいメディアエンジンの貢献が大である。アイドルとWebブラウズのケースは、1W以下の電力減であり、RichlandでのCPUやGPUのエネルギー効率の改善はわずかとも言えるが、主要なコンポーネントは同じであるので、これはやむを得ないところであろう。

アイドル、Webブラウズ、720pビデオプレイバックの場合のRichlandとTrinity APUの消費電力の比較

また、前世代のTrinityとCPUコア、GPUコアともに同じであるが、Richlandでは、ターボブーストなどの改善でCPU性能が最大29%向上し、GPU性能が最大41%向上している。