Intelの14nmプロセサ「Broadwell」の電力管理技術(前編)はコチラ

COOL Chips XVIIIの記事一覧はコチラ

BroadwellではFIVRをフル活用して低電力を実現

Broadwellでは、CPUパッケージに搭載した「FIVR(Fully Integrated Voltage Regulator:ファイバーと発音する)」をフル活用して、電力低減を行っている。従来は、安定化電源はマザーボードに実装され、プリント板配線でチップに接続していた。この場合、配線層やパッケージの端子数の制約から、多種の電圧の電源をチップに供給することは難しかった。その結果、マルチコアのプロセサでもコアごとに動作状態に応じて最適の電圧を供給するという訳には行かなかった。

これに対して、FIVRは多系統の安定化電源をプロセサチップに内蔵している。例えば、Broadwellの場合は、「Core0」、「Core1」、「Graphics0」、「Graphics1」、「Cache」、「System Agent」、「IO digital」、「IO Analog」の8系統の電源をもっている。正確にいうと、安定化電源を構成するトランジスタや制御回路はプロセサチップに内蔵されているのであるが、スイッチング電源に必要な大電流を流せるコイルをチップに内蔵することは難しいので、FIVRではCPUパッケージ基板の多層配線を利用してコイルを作っている。

次の図のように、Broadwellは2段の安定化電源を使っている。1段目の電源はマザーボードに搭載され、1.3~1.8Vの電源をチップに供給する。そして、CPUパッケージに搭載されたFIVRで1.8Vからこの8系統の電源を作り出している。これらは独立の安定化電源であるので、各ブロックの動作状態に応じて最適な出力電圧に調整することができる。従来は最もビジーなコアが必要とする高い電源電圧をすべてのコアに供給していたが、個別設定が可能になったことで無駄な電力を削減することができるようになった。

Broadwellは2段の安定化電源を使い、CPUパッケージに内蔵した第2段のFIVR電源で各部の電源電圧を個別に調整できるようになっている

次のグラフの横軸はチップの電源電流で、縦軸は第1段電源の出力電圧である。チップへ供給する電流が大きくなると、第1段の電源の出力電圧が1.8Vから下がり、最大の電流の場合にチップに必要な最小電圧(約1.6V)になるように設計されている。これでも良いのであるが、Broadwellではチップの動作状態に応じて第1段の電源の出力電圧を変えている。これにより1.5~2Wの消費電力の場合で、145mW(7~10%)の電力削減ができるとのことである。

負荷状態に応じて、第1段の電源の出力電圧を調整して7~10%電力を削減

待ち受け時間の長いタブレットなどでは、アイドル状態での消費電力を減らすことが非常に重要である。そのためには、完全に電源を切ってしまうのが一番電力が減るが、動作を再開するまでの時間が長くなり、使いにくくなってしまう。そのため、Intelのプロセサは多くのレベルの待機状態を持っている。

C0状態はCPUコアもGPUもフルに動いている状態で、4.5Wを消費する。これに対して、C6状態はCPUコアやGPUの電源はオフで、DRAMメモリもSelf-Refresh状態でデータを保持できる最低電力の状態となる。C6状態の消費電力は230mWであるが、処理の再開までに45μs掛かる。C7状態はDRAMやメモリコントローラもオフにし、消費電力を145mWに下げるが、再開に必要な時間は65μsに増加する。

C8状態ではディスプレーやFIVRの動作を止め、第1段の電源の出力電圧も1.3Vに下げる。消費電力は4.5mWと大幅に低下するが、再開には135μs掛かる。C9/C10状態では第1段の電源の出力電圧を0Vにして、電源も制御回路の電力も低減する。これにより消費電力は1.4mWに下がるが、再開には200μs~2.5msを要する。

Broadwellは、このように多様な待機状態を持っているので、プログラムの動作状態に応じて適切な待機状態を使うことにより、待機電力を大幅に削減することができる。なお、FIVRは発振周波数が高く、電源オフからオンへの切り替わり時間が短いので、従来のプロセサに比べて再開時間が短くなっている。

BroadwellはC6~C10という各種の待機状態をもっている。C6の消費電力は230mW、C10では1.4mW。一方、待機状態を深くすると動作の再開に時間がかかる

次の図はC6、C7、C10状態のチップを観測したもので、チップ内で動作しているトランジスタが出す赤外線を写すIREMという装置で撮影している。白く写っている部分が回路が動作している部分である。C6ではCPUコアやGPUのところは暗いが、動作している部分がかなり残っている。C10になると再開情報を保持する「Retention SRAM」と必須のIOが動いている程度で、全体が暗く写っている。

動作しているトランジスタが白く写るIREMで観測したC6、C7、C10状態

タブレットやPCでは、ユーザが画面を眺めている時間が長い。この状態ではCPUやGPUは動作する必要はなく、DRAMに格納された画像データを定期的に読み出してディスプレーに送ればよい。このため、Broadwellでは「C7+」という状態を作った。C7+状態では、CPU、GPU、キャッシュの電源はオフにする。この状態ではチップの消費電流は小さいので、FIVRを止めてLDOというタイプの電源に切り替える。

また、FIVRが止まっているので、第1段の電源の出力電圧を1.3Vに下げる。これによりディスプレーだけを眺める状態の消費電力を30%低減できるという。

ディスプレーを眺めているだけでCPU、GPUが動く必要がない場合は、C7+状態が使える。この状態にすると30%電力を減らせる

次の図はC7+の実装のより詳しい図であるが、CoreとGraphics、L3Cacheの5系統のFIVRはオフ。System Agent、IO digital、IO Analogの3系統は必要な電流値が小さくなるので、FIVRを止めて並列に設置されているLDO安定化電源から供給する。FIVRは100MHz以上という高い周波数で発振するので、低出力電流でもこの部分でかなりの電力を消費してしまう。一方、LDOは入力電力に対する出力電力という観点では効率が低いが、出力電流が小さい場合はロスとなる電力の絶対値はFIVRより小さくて済む。

また、メモリコントローラやDRAM、ファブリックなどはパワーゲートして間欠動作させて電力消費を減らす。

C7+状態の実現手段の詳細図

結果として、前世代のHaswellと比較すると、Broadwellは、Windows 8.1のアイドル状態では60%少ない電力、HDビデオのプレーバックでは21%少ない電力、ウェブブラウジングでは38%少ない電力となっている。

このように、Broadwellは14nmプロセスの採用と電力管理の改善により、消費電力が4.5W以下のファンレスの機器において、前世代のHaswellと比較すると、最大50%高い性能と最大25%長いバッテリ寿命を実現している。

4.5Wの消費電力のファンレス機器において、Broadwellは、前世代のHaswellと比較すると最大50%高い性能と最大25%長い電池寿命を実現した

このようにBroadwellでは動く必要のない部分の電気は徹底して止めることにより、大きな低電力化を実現している。特に、CPUコアやグラフィックスコアごとに動作状態に応じて最適な電源電圧を供給できるFIVRの採用は、低電力化に大きな効果をもたらしている。

COOL Chips XVIIIの記事一覧はコチラ