32nm FD-SOIプロセスで作られたプロセサコアは、電源電圧1.1Vでは1.78GHzで動作する。電源900mVでは1.24GHz、560mVの電源では115MHzで動作する。次の表に、プロセサ、メモリタイルとパケットルータの動作クロックを示す。なお、メモリは、最低でも760mV程度の電源電圧がないと動作できないようである。

3つの電源電圧でのプロセサ、メモリとパケットルータの動作周波数

次の図に3種の電源電圧でのプロセサ、メモリ、パケットルータの消費電力を示す。プロセサは1.1Vでは38.8mWを消費するが、560mVの電源では0.7mWで動作できる。

3つの電源電圧でのプロセサ、メモリとパケットルータの消費電力

次の表は他のチップとの比較で、赤字は商用のプロセサ。青字は研究用のプロセサである。KiloCoreは1000コアという集積度、0.055mm2というプロセサ面積、エネルギー遅延積、バイセクションバンド幅などの点で、過去のチップを上回っている。

KiloCoreは集積度だけでなく、色々な指標で、過去のチップを上回っている

FFT、AES、LDPC、レコードソートと言ったアプリケーションをKiloCoreに実装した。FFTでは長さ4096、16bit固定小数点データの処理に980コアと12メモリタイルを使用し、毎秒138K回のFFTを4Wの消費電力で実行できた。128bitキーを使うAESは、974コアを使い14.9Gbit/sで処理を行うことができた。消費電力は9.1Wである。LDPCは111Mbit/sで処理でき、消費電力は3.4Wである。ソートは12.4Mレコード/sで処理でき、消費電力は0.8Wであった。

FFT、AES、LDPCとレコードソートをKiloCoreに実装して、性能と消費電力を測定した

この性能をCore i7-3770Kプロセサと比較したのが次の図である。2つのグラフの上側は正規化したスループットの比較で、KiloCoreはAESでは14.6倍、LDPCでは3.5倍の性能となっているが、 Core i7の方がFFTでは1.9倍、Sortでは3.1倍のスループットとなっている。下側のグラフは消費電力あたりのスループットで、こちらは、AESでは79倍、LDPCでは53倍、FFTでも8倍、ソートでは23倍と4つのアプリケーションともにKiloCoreの方が上回っている。

KiloCoreとIntelnのCore i7-3770Kとの比較は、スループットでは、AESは14.6倍、LDPCでは3.5倍とKiloCoreの方が性能が高いが、FFTでは1.9倍、ソートでは3.1倍とCore i7の方が性能が高い。しかし、スループット/Wでは、AESで79倍、LDPCで53倍、FFTで8倍、ソートで23倍とすべてKiloCoreが勝っている

KiloCoreチップはストリーム的な処理を行うFPGAのような感じで、プロセサタイルはFPGAのLUTに相当し、スイッチネットワークやパケットルータはLUT間を接続する配線という感じがするのであるが、面白いアプローチである。このようなやり方で何が作れるのかを研究して行くと、面白い発見が出てくるのではなかろうか?