今回のSC07では、268件の応募論文の中から選ばれた54論文が発表された。その発表論文の中で、最優秀論文賞を獲得したのは、The Cray BlackWidow: A Highly Scalable Vector Multiprocessorと題するCray社の論文である。
最優秀論文賞を獲得した論文を発表するCray社のChief Technical OfficerのSteve Scott氏。 |
本物のBlack Widowは毒蜘蛛であり、この発表のスライドの右上には全て黒い蜘蛛が描かれていた。それはともかく、CrayのBlack Widowは、現行のX1Eの次世代となるベクトルコンピュータであり、Crayの正式製品名はX2である。
X2 CPUはTSMCの90nmプロセスで製造され、1.6GHzのクロックで動作する。8本のベクトルパイプを持ち、プロセサあたりの性能は25.6GFlopsとなっている。そして、このプロセサ4個が共通のメモリにアクセスできるSMP構成が一つの計算ノードとなっている。CPUチップに内蔵される2次キャッシュは0.5MBと小さいのであるが、メモリモジュールのDRAMコントローラの中に、全体で8MBになる3次キャッシュが入っているという感じの絵が描かれている。この3次キャッシュの対するバンド幅は、プロセサあたりRead側が34GB/s、Write側が17GB/sであり、単純に合計すると2B/Flopという比率になる。
そして、この4CPUノード間を64ポートのYARCと呼ぶルーターチップで構成したFat Treeインタコネクトで接続している。論理的には最大32K CPUまで接続可能とのことであるが、製品としては1024CPUが最大となっている。メモリは、このノード間インタコネクトを経由して、他のノードからも共通にアクセスすることが可能であり、全CPUのキャッシュのコヒーレンスが取られた単一メモリ空間を構成する。
物理的には、この4CPU とメモリモジュールからなるノードを1枚のブレードの2個搭載し、8枚のブレードで1シャシーを構成している。そして、一つの筐体には、このシャシーが2個搭載され、128CPUを収容する。筐体の裏側からは、 2個のYARCチップを搭載したスイッチボードが、必要バンド幅に応じて、2枚、あるいは4枚挿入され、ノード間接続のFat Treeインタコネクトを形成する。
そして、発表の後半では、CPUチップのフロアプラン、ベクトルユニットのブロックダイヤグラムと、全ノードのメモリを単一空間としてアクセスするためのアドレス変換のやり方などが述べられた。