Roadrunnerでは、2個のPowerXCell 8iチップを2個搭載したQS22ブレードを2枚と2コアのOpteron CPUを2個搭載したLS21ブレードの3枚のブレードからなるTri-Bladeが構成単位となっている。

なお、Tri-Bladeと言っているが、LS21ブレードにQS22ブレードを接続する部分にExpansion Bladeという接続用のブレードが必要であり、実際には4枚のブレードが使われている。

次の図に見られるように、QS22ブレードには2個のCell eDP(Cell extended Double Precision)チップが搭載され、Cell eDPからのFlexIOの信号をI/O HUBでPCIe x8に変換し、Expansion Blade経由でLS21ブレードのOpteronに接続している。メモリはQS22ブレードにはCell eDPのDDR2メモリが搭載され、LS21ブレードにはOpteron用のDDR2メモリが搭載されている。

LS21ブレードでは2個のデュアルコアOpteronが搭載され、2個のOpteronはHyperTransport x16で相互接続されており、キャッシュコヒーレントに接続されているが、Cell eDPはチップごとに独立のメモリ空間をもつという構造になっている。

  • Roadrunner

    図5 RoadrunnerはAMDのデュアルコアOpteronを2個搭載するLS21ブレードとCell eDPを2個搭載するQS22ブレード2枚からなるTri Bladeを単位として作られている

図5はブレードの写真が載っていて実装の感じは掴めるのであるが、次の図6の方はSC 2008の発表論文であり、技術的には詳しい記述である。そして、図6ではExpansion Bladeから4xのDDR Infinibandのポートが書かれている。このポートが、後述のようにシステムのネットワークにTri-Bladeを接続するためのポートである。

  • Roadrunner

    図6 SC 2008で発表された論文に載っているシステムのブロック図

そして3つのTri-bladeをBlade Centerシャシーに入れ、180セットのTri-Bladeを1台のVoltair製のISR2012スイッチでまとめる。これをConnected Unit(CU)と呼ぶ。CUからは96リンクが第2段のスイッチに接続されている。

  • Roadrunner

    図7 ISR2012 InfiniBandスイッチを中心に180Tribladeを繋ぐConnected Unit

そして、図8のように18台(本当は17台で足りる)のCUを8台の第2段のIBスイッチでまとめて全体のネットワークが出来上がる。第1段のCUから、第2段の各スイッチへの接続は12リンクである。

全体でデュアルコアのOpteronの個数は6480チップで、Cell eDPチップの個数はその2倍の12960チップである。Opteron部の演算能力は47TFlops、Cell eDP部の演算能力は1.3PFlopsである。

  • Roadrunner

    図8 8台の2段目のスイッチで18個のCUの間を接続する