CMOSの消費エネルギーと動作速度

CMOS論理ゲートの出力の1回のスイッチに伴う消費エネルギーは0.5C×V2である。ここでCは論理回路の負荷容量、Vは電源電圧である。この式にはクロック周波数fは含まれておらず、同じ回数のスイッチであれば、クロックを上げて短い間隔スイッチしても、低いクロックでゆっくりした間隔でスイッチしても消費エネルギーは変わらない。

一方、CMOS論理ゲートのスイッチング速度は、負荷となる容量Cを電源電圧VからV/2に放電する時間で決まる。MOSトランジスタのドレイン電流をIdとすると、スイッチ時間はt=0.5×C×V/Idとなる。そして、クロック周波数fはスイッチ時間の逆数に比例するのでf ∝ 0.5×C×V/Idとなる。

Idは古典的なトランジスタの教科書ではI0×(V-Vt)2と表される。ここでI0はトランジスタの設計で決まる定数で、VtはMOSトランジスタのスレッショルド電圧である。ここで、話を簡単にするためVt=0と考えると、IdはVの2乗に比例する。そうするとスイッチ時間tはVに逆比例し、クロック周波数はVに比例することになる。

つまり、消費エネルギーを減らすために電源電圧Vを低くするとスイッチ速度が遅くなり、クロックはあげられない。

図3.13 消費エネルギーJとクロック周波数fの電源電圧Vの依存性

もう1つの消費エネルギーの削減方法は、論理ゲートに使用するトランジスタを小さくするという方法である。配線は短くその寄生容量は無視できるとすると、回路の負荷となるCはトランジスタの寄生容量であり、トランジスタのサイズを半分にするとCも1/2になる。従って、1回のスイッチに伴う消費エネルギーは1/2になる。この場合は、トランジスタサイズが半分であるので、Idも1/2になり、スイッチ速度は変わらない。

CMOS論理回路のライブラリで、7トラックとか9トラックとかいう話を聞いたことがあるかと思うが、これは基本セルの高さが配線7本分とか9本分とかいうサイズを表している。CMOS回路はNとPの両方のトランジスタを必要とするので、7トラックの場合はPトランジスタのサイズWpが3トラック、NトランジスタのサイズWnが2トラック分で、P-Nトランジスタの間の空きや上下の基本セルとの空きを考えると7トラックが事実上は最小ということになる。

図3-14に7トラックのインバータの例を示す。

図3.14 7トラックインバータの例

配線の寄生容量が無視できる場合は、スイッチ速度はトランジスタのサイズによらないが、現実には配線容量は無視できない。特にクロック周波数を決める遅延時間の長い信号経路では配線容量が大きな比重を占めることが多い。

このため、速度より消費電力、チップサイズを重視するGPUやASICは7トラックの基本セルを使い、より速度を重視するASICでは9トラック、速度が非常に重要なCPUでは11トラックや13トラックの基本セルを使うというような使い分けがされている。なお、トラック数を+2する場合は、WnとWpをそれぞれ+1する。

7トラックのセルを使うとCが小さくなり消費エネルギーを減らせるが、配線容量が大きいところではクロック周波数がサイズに比例して低くなってしまう。つまり、小さなトランジスタを使うと消費エネルギーは減らせるが、その分、クロックは下がってしまう。

結論として、CMOSチップの設計には電源電圧と基本セルのサイズという調整ツマミがあり、これを絞ると消費電力は下がるが、動作クロックは低下して行くということになっている。

調整ツマミをどこに設定するのか

CPUの場合は1つのスレッドを高速で実行する必要があるので、スイッチ速度が速いことが重要であるので、クロックが下がって命令の実行速度が下がる設定は選びにくい。といっても、消費電力が150Wを超えると冷却が難しくなるので、現実には、やむなく、ツマミを絞るということが行われる。

しかし、GPUの場合は多角形の頂点の1つ1つ、あるいはピクセルごとの処理が個別のスレッドとなり、大量のスレッドがあるので1つのスレッドを短時間で実行しなくても、多数のスレッドを並列に実行するハードウェアとすれば性能を稼げる。このため、GPUの設計としては、速度は遅くても、消費電力が少なく、チップ面積も小さくなるトラック数の小さい基本セルを使う。また、消費電力を下げることを優先し、電源電圧を下げて低いクロックで動かすことになる。

この結果、NVIDIAなどのハイエンドのGPUでもクロックは0.7~1.1GHz程度であり、IntelがCoreプロセサやAtomプロセサに組み込んでいるGPUでは300MHzとか600MHzという非常に低いクロックで動かしている。3GHzを超える品種もあるIntelのXeon CPUと比べるとGPUは低いクロックとなっているのは、電源電圧と基本セルのサイズという調整ツマミを絞った結果である。