8月26日のHOT CHIPSのPC Chipsセッションで、中国科学院のGodson-3プロセサのマイクロアーキテクチャと題する発表が行われた。

中国は国家戦略として高性能CPUの開発を行っており、National Key Projectとして2020年までのサポートが決まっているという。その開発の中心が中国科学院(Chinese Academy of Science)のICT(Institute of Computing Technology)である。ICTは2001年からCPUの開発を開始し、2002年には32ビットプロセサであるGodson-1を完成している。このプロセサは中国で開発された最初の汎用マイクロプロセサである。

そして、2003年10月には64ビットアーキテクチャのGodson-2Bプロセサ、更に2004年12月にはGodson-2C、2006年3月にはGodson-2Eを完成している。これらのプロセサは、それぞれ前世代のプロセサの3倍の性能と、急速に性能を向上させている。

Godson-2Eプロセサは、MIPS-III命令アーキテクチャの64ビットプロセサで、4命令並列発行のOut-of-Order実行のマシンである。90nmプロセスで製造されているが、クロックは1.0GHzであり、日米のハイエンドプロセサと比べると低く抑えられている。しかし、チップサイズは36平方mmと非常に小さく、消費電力も5~7Wと小さい。

このように小チップで低電力のターゲットであるので、Godson-2EプロセサのSPEC2000性能は、SPECint2000、SPECfp2000ともに503というスコアであり、同時期の3.0GHzクロックのIntel Xeonが1500程度のスコアを叩き出しているのに比べると1/3程度の性能に留まっており、発表者は、まだ、先進国とは開発力のギャップがあると述べていた。

また、Godson-2Eに続いて、PCIやPCIXなどの業界標準のI/OをサポートするGodson-2Fを開発しており、このチップは、現在、量産されているという。

これらのGodson開発の次世代プロセサがGodson-3である。このGodson-3は、次の図に示すように野心的な計画である。最大規模のシステム全体は、4×4のメッシュ構造に接続された計算ノード群からなり、各計算ノードは4つのプロセサコア(P0~P3)と4つのL2キャッシュ、そして東西南北の計算ノードと接続するポートとそれらを接続する128ビット幅で8×8ポートのクロスバからなっている。Godson-3の最初の世代は65nmプロセスを使い、1GHz以上のクロックを目指している。

Godson-3のスケーラブルアーキテクチャ

プロセサコアは、2種類が計画されており、一種類は、現在のGodson-2のものをベースにクロスバポートに接続するAXIインタフェースを追加したGS464 コアである。そして、もう一種類のコアは、科学演算性能を強化するSIMDコアで、8個の積和演算器をもつGSteraコアである。このクロスバで接続されたL2キャッシュはグローバルに他の計算ノードからもアクセス可能であり、ディレクトリベースのキャッシュコヒーレンシをサポートすると書かれている。

また、次に示す2009年の8コアシステムの図では、L2$の反対側にもポートがあり、メモリやI/Oを接続するクロスバスイッチに接続されている。

2009年の8コアシステムの構成図

しかし、ノード間の接続ポートは1ポートとなっており、両端のポートからはDMAコントローラを経由してHyperTransportやPCIEが出ている。しかし現在、開発しているのはHT1.0であり、キャッシュコヒーレンシ機能は無いとのことで、2009年の実現計画では、L2キャッシュ全体をディレクトリでコヒーレントというグランドデザインには到達していないと思われる。